Favio Vázquez
Cosmólogo y Data Scientist
@faviovaz
Escuela Politécnica Nacional
02/03/18
La Ciencia de Datos es la resolución a problemas de Negocio/Organizaciones a través de las matemáticas, la programación y el método científico que implica la creación de hipótesis, experimentos y pruebas mediante el análisis de datos y la generación de modelos predictivos. Se encarga de transformar estos problemas en preguntas bien planteadas que también puedan responder a la hipótesis inicial de una manera creativa. También debe incluir la comunicación efectiva de los resultados obtenidos y cómo la solución agrega valor al Negocio/Organización.
Esperemos que si.
Un Data Scientist es una persona encargada de analizar problemas de negocio/organizaciones y darle una solución estructurada partiendo por convertir este problema en una pregunta válida (qué, cómo, por qué, para qué, etc) y completa, luego mediante herramientas de programación y cómputo desarrollar códigos que limpien preparen y analicen los datos a trabajar para luego crear modelos y responder a la pregunta inicial.
Python es un lenguaje de programación interpretado, orientado a objetos y de alto nivel con semántica dinámica.
R es un lenguaje y entorno para computación y gráficos estadísticos. Es un proyecto de GNU que es similar al lenguaje y entorno S que se desarrolló en Bell Laboratories.
Es un motor general y muy rápido para el procesamiento en paralelo de datos en gran escala.
Favio Vázquez
Cosmólogo y Data Scientist
@faviovaz