¿Qué problema has tu solucionado, que vale la pena resolver, en donde conocías toda la información de antemano?
En donde tu no tenías la información suficiente para filtrar o no tenías la suficiente información para encontrar algo?
¿Por qué la ciencia de datos estadísticos? - El análisis de los datos permite mejorar los procesos, cuando se utiliza para darle sentido a los datos.
Es un lenguaje Open Source para estadísticos, ingenieros y científicos sin conocimientos de programación. Contiene una serie de mecanismos integrados para organizar los datos, ejecuta los cálculos sobre la información y crea representaciones gráficas de los conjuntos de datos. (Tiene gran cantidad de paquetes para realizar análisis de datos).
Entre los paquetes que existen se puede encontrar:
- BiodiversityR: Interfaz para el fácil cálculo de tendencias ambientales.
- Emu: Analiza patrones de expresión.
- GenABEL: Estudiar el Genoma Humano.
Tiene un excelente entorno de desarrollo - Rstudio http://www.rstudio.com/
Tiene un muy buen ecosistema de desarrolladores.
Cuenta con plugins para: Acceso a datos, Limpieza de datos, Análisis y Presentación de datos.
- ?rnorm: Saber el archivo de ayuda para la función rnorm.
- help.search("rnorm"): Buscar archivos de ayuda.
- args("rnorm"): obtener los argumentos de una función.
- rnorm: visualizar el código de la función.
Leer las líneas de una página Web
- Asignar un peso a las variables para el análisis previo de los datos (Variables categóricas, continuas, etc).
- Análisis de factores para identificar variables y procesos que tendrá el modelo (Aprendizaje supervisado)
- Recalibración: El modelo se debe refinar con el tiempo, es decir el proceso es continuo y se vuelven a identificar los factores del proceso.
- Tools:
Visual Studio Code Tools for AI