Introducción a la Ciencia de Datos

(Laboratorio #2)

 

 

Facultad de Ciencias

Universidad Central de Venezuela

Pre-procesamiento de datos

  • Extracción e integración de los datos.
  • Preparación de los datos.
  • Análisis y ajuste de la dimensionalidad.

Extracción e integración de los datos.

  • Diversidad de fuentes.
  • Datos estructurados o no estructurados.
  • Extract - Transform - Load - (Clean)*

Extracción e integración de los datos.

  • Data warehouse.
  • Transformación de los datos (Ejemplo: Logaritmos) .
  • Extract - Transform - Load - (Clean)*

Preparación de los datos.

  • Normalización o estandarización .
  • Categorización.
  • Edición de datos (si es necesario).
    • ​Eliminación de datos faltantes(registros).
    • Imputación de datos (campos).

Análisis y ajuste de dimensionalidad.

Made with Slides.com