Introducción a la Ciencia de Datos
(Laboratorio #2)
Facultad de Ciencias
Universidad Central de Venezuela
Pre-procesamiento de datos
Extracción e integración de los datos.
Preparación de los datos.
Análisis y ajuste de la dimensionalidad.
Extracción e integración de los datos.
Diversidad de fuentes.
Datos estructurados o no estructurados.
E
xtract -
T
ransform -
L
oad - (
C
lean)*
Extracción e integración de los datos.
Data warehouse.
Transformación de los datos (Ejemplo: Logaritmos) .
E
xtract -
T
ransform -
L
oad - (
C
lean)*
Preparación de los datos.
Normalización o estandarización .
Categorización.
Edición de datos (si es necesario).
Eliminación de datos faltantes(registros).
Imputación de datos (campos).
Análisis y ajuste de dimensionalidad.
Made with Slides.com