Introducción a las visualizaciones interactivas
Alejandro Vidal
License with ♥ CC BY-SA
Psicómetra & analista de datos
OWLMET
Bajo nivel
Alto nivel
Herramientas
Herramientas
Pros:
LA librería por excelencia
Altísima personalización (Data-Driven Documents)
Pros:
d3 sencillo
Contras:
Bajo nivel
Buen conocimiento de Javascript & co
Pros:
Poca curva de aprendizaje desde R
Crear interacciones es muy sencillo
Tiempo Real
Contras:
Sólo visualizaciones con servidor
Shiny server Pro para despliegues importantes
Pros:
Con servidor o sin servidor
Adaptada para Big Data
Tiempo Real
Librerías en R, Python, Julia, Scala...
Mucha flexibilidad (3 niveles de API)
Contras:
Documentación en construcción
Hay gente que denominaría a esto
diagrama de dispersión, pero...
...Realmente es una tabla. Aquí la tenéis mejor hecha:
Moraleja: Cualquier cosa no es visualizar datos
Pros:
LA librería por excelencia
Altísima personalización (Data-Driven Documents)
Pros:
d3 sencillo
Contras:
Bajo nivel
Buen conocimiento de Javascript & co
Pros:
Poca curva de aprendizaje desde R
Crear interacciones es muy sencillo
Contras:
Sólo visualizaciones con servidor
Shiny server Pro para despliegues importantes
Pros:
Con servidor o sin servidor
Adaptada para Big Data (Downsampling & Canvas)
Librerías en R, Python, Julia, Scala...
Mucha flexibilidad (3 niveles de API)
Contras:
Documentación en construcción
Conversación
realficticia
Que guay este superproyecto con _empresa molona_ con _muchos_ GB de datos. Pero hago una gráfica de puntos con una opacidad del 0.000001% por punto y tarda UNA HORA
¿Para qué queréis ese diagrama de puntos?
Es que tenemos más de dos variables.
:-| Ya... Bueno, ¿en qué terminal lo estáis reproduciendo?
Una tostadora con llamas a los lados y corriendo Windows 95
Ajá... Podéis hacer una rejilla y hacer un mapa de calor [downsampling]
¡¡Pero entonces no es sexy!!
¿Y si agrupáis los sujetos por proximidad? [downsampling II]
¡¡Pero entonces no es Big Data!!
Factores clave para elegir herramienta
¿Tiene que ser offline?
¿Cantidad de datos? ¿CPU?
Tiempo
(Quieren decir dinero)
Datos estáticos / dinámicos
Equipo(lenguajes y código heredado)
Shiny
NVD3, Bokeh, dimple
D3, NVD3, rCharts
Bokeh
D3
Shiny, dimple, rCharts
rCharts
Shiny, Bokeh, D3
Shiny, MPLD3
Los verdaderos puntos fuertes
Enlazado o Linking
- Existe enlazado de ejes: "todos los ejes se mueven a la vez"
- Enlazado de selección: "la selección en una gráfica se selecciona en otra"
Ayuda a explorar alta dimensionalidad
Análisis detallado de outliers o concentraciones
Los verdaderos puntos fuertes
Interactividad
- Puede ser sencilla, por ejemplo: zoom y selección
- Avanzada: con widgets. Inputs de parámetros o manipular datos
- Casos típicos: filtrar entidades y cambiar variables
Útil en contextos con interacciones complejas entre variables
Permites al usuario explorar los datos de forma autónoma
(te ahorras hacer mil gráficas)
Los verdaderos puntos fuertes
Animación
- Puede estar basada en servidor o en cliente ¡cuidado con la latencia!
- Ayuda en contextos de tiempo real
- ¡Por fin una cuarta dimensión!
Muy útil para tiempo real
MUY útil para representar tiempo
Sexy "vs" Funcional
Esto...
es una tabla
Esto...
también
Sexy "vs" Funcional
Esto...
es un bonito salvapantallas
Sexy "vs" Funcional
y esto:
es Visualización de Datos (con mayúsculas, sí)
Muchas
gracias
¿Preguntas? =)
Alejandro Vidal
License with ♥ CC BY-SA
Psicómetra & analista de datos
OWLMET
Introducción a las visualizaciones interactivas
By Doble Pensador
Introducción a las visualizaciones interactivas
Presentación breve para la Data Science Spain 2015. Demostración de las distintas librerías (con énfasis en R y Python) y ejemplos relevantes.
- 1,470