El rol del Big Data y Data Scientist en la Cosmología

Favio Vázquez
Cosmólogo y Data Scientist


@faviovaz





6 de abril de 2016
Seguir presentación en vivo

Resumen

¿Qué es el Big Data?
Actuales tendencias en Big Data
¿Quién es un Data Scientist?
¿Cuál es el papel del BD y el DS en la cosmología?
Big Data

¿Qué es?
Son los diversos tipos de procesos y estrategias de recolección, guardado y análisis que incluyen e integran distintos tipos de datos que no podrían ser estudiados con técnicas tradicionales de minería de datos.

Big Data

¿De dónde vienen estos datos?




Big Data

Primera Generación
Supercomputadoras



DATOS
ANALÍTICA
PERSONAS (DS)



Big Data

Segunda Generación
Data Warehouse



DATOS
ANALÍTICA
PERSONAS (DS)

Datos Estructurados
Analítica descriptiva
Enfocado en BI
Big Data

Tercera Generación
Hadoop + Data Lake



DATOS
ANALÍTICA
PERSONAS (DS)
Complicado centralizar datos
Herramientas muy complejas
Desarrolladores expertos en Big Data


Datos con poco valor sin ETL
Big Data

Nuevo Paradigma

Data Scientist
¿Quién es?

El encargado de saber todo lo necesario para poder utilizar las herramientas, lenguajes, plataformas y sistemas utilizados para analizar Big Data

Data Scientist
¿Qué debe saber?




Rol en Cosmología

¿En qué etapa del Big Data está la cosmología?
Primera :(

PERO ...
Rol en Cosmología

El futuro es brillante
Cosmología Open Source
Proyectos DS + Cosmología
Técnicas BD + Cosmología
Nuevos Lenguajes y Herramientas
Data Scientist interesados en Cosmología




¿Preguntas? ¿Dudas?

Favio Vázquez
Cosmólogo y Data Scientist


@faviovaz


Cosmología + Machine Learning
Laboratory for Computation, Data, and Machine Learning

Machine Learning and Cosmological Simulations I: Semi-Analytical Models
Machine Learning and Cosmological Simulations II: Hydrodynamical Simulations
Apache Spark


El Rol del Big Data y Data Scientist en la Cosmología
By Favio Vazquez
El Rol del Big Data y Data Scientist en la Cosmología
Charla a dar el 6 de abril en CINVESTAV
- 1,882