Big Data Scientist

¿Qué problema has tu solucionado, que vale la pena resolver, en donde conocías toda la información de antemano?

En donde tu no tenías la información suficiente para filtrar o no tenías la suficiente información para encontrar algo?

Datos curiosos...

¿Por qué la ciencia de datos estadísticos? - El análisis de los datos permite mejorar los procesos, cuando se utiliza para darle sentido a los datos.

Ganar 3 millones de dolares...

Los elementos del Estilo de análisis de datos

¿Por qué R?

Es un lenguaje Open Source para estadísticos, ingenieros y científicos sin conocimientos de programación. Contiene una serie de mecanismos integrados para organizar los datos, ejecuta los cálculos sobre la información y crea representaciones gráficas de los conjuntos de datos. (Tiene gran cantidad de paquetes para realizar análisis de datos).

Entre los paquetes que existen se puede encontrar:

- ​BiodiversityR: Interfaz para el fácil cálculo de tendencias ambientales.

- Emu: Analiza patrones de expresión.

​- GenABEL: Estudiar el Genoma Humano.

 

Tiene un excelente entorno de desarrollo - Rstudio http://www.rstudio.com/

Tiene un muy buen ecosistema de desarrolladores.

Cuenta con plugins para: Acceso a datos, Limpieza de datos, Análisis y Presentación de datos. 

Funciones importantes

- ?rnorm: Saber el archivo de ayuda para la función rnorm.

- help.search("rnorm"): Buscar archivos de ayuda.

- args("rnorm"): obtener los argumentos de una función.

- rnorm: visualizar el código de la función.

https://cran.r-project.org/doc/contrib/Short-refcard.pdf​

Leer las líneas de una página Web

- Asignar un peso a las variables para el análisis previo de los datos (Variables categóricas, continuas, etc).

- Análisis de factores para identificar variables y procesos que tendrá el modelo (Aprendizaje supervisado)

- Recalibración: El modelo se debe refinar con el tiempo, es decir el proceso es continuo y se vuelven a identificar los factores del proceso.

- Tools:
  Visual Studio Code Tools for AI

Inteligencia artificial

Big Data Scientist

By Juan David Nicholls

Big Data Scientist

  • 2,156