Introducción a la Ciencia de Datos

(Laboratorio 1)




Facultad de Ciencias

Universidad Central de Venezuela

 

Objetivos


  1. Conocer los fundamentos teóricos y aspectos tecnológicos asociados a la computación de grandes volúmenes de datos..
  2. Describir los aspectos teóricos y tecnológicos de los sistemas de cómputo de grandes volúmenes de datos..
  3. Utilizar métodos y herramientas para el análisis y procesamiento de grandes volúmenes de datos..

Métodos


  • Manipulación de datos:
    • ETL
  • Métodos estadísticos:
    • Descriptivos.
    • Predictivos.
  • Visualización científica.
  • Inteligencia artificial.
  • Análisis numérico.

Herramientas


  • R (Rstudio).
    • Permite crear salidas de visualización de datos de gran calidad.
  • Python.
    • Provee las mejores funcionalidades en manejo de textos.

...Key skills of a data scientist & how do i become a data scientist.


Herramientas


Fuentes


Evaluación*


  • 20%:
    • Laboratorios presenciales.
      • swirl (R package)
    • Asignaciones.
      • source_A[1:n].R .
      • Informe.
  • 35%:
    • Proyecto.

R you Ready?



R - Básicos


Ayuda:

?[function_name]
Ejemplos:
example("[function_name]")

R - Básicos


Directorio de trabajo actual:

getwd()
Ir a directorio:
setwd("[dir_destino]")
Listar archivos en dir. de trabajo actual:
dir()

R - Básicos


Objetos existentes en espacio de trabajo actual:

ls()
Estructura de un objeto:
str("[obj_name]")
Eliminar objetos:
rm("[obj_name]")
rm(ls()) #elimina todos los objetos retornados por ls()

R - Básicos 


Instalación de paquetes:

 install.packages("[package_name]")
install.packages("[package_name]", dependencies= T)

Carga de paquetes:

 library("[package_name]")
Desintalación de paquetes:
 remove.packages("[package_name]")

R - Básicos 


Actualización de paquetes:

update.packages(["package_name"])

Desmontar paquetes:

detach("package:[package_name]", unload= T)

Made with Slides.com