Introducción a las visualizaciones interactivas

Alejandro Vidal

License with  CC BY-SA

Psicómetra & analista de datos
OWLMET

Bajo nivel 

Alto nivel 

D3

Herramientas

D3

Herramientas

Pros:
LA librería por excelencia
Altísima personalización (Data-Driven Documents)

Pros:
d3 sencillo

Contras:
Bajo nivel

Buen conocimiento de Javascript & co

Pros:
Poca curva de aprendizaje desde R
Crear interacciones es muy sencillo
Tiempo Real

shinyapps.io

Contras:
Sólo visualizaciones con servidor
Shiny server Pro para despliegues importantes

Pros:
Con servidor o sin servidor
Adaptada para Big Data
Tiempo Real
Librerías en R, Python, Julia, Scala...
Mucha flexibilidad (3 niveles de API)

Contras:
Documentación en construcción

Hay gente que denominaría a esto
diagrama de dispersión, pero...

D3

...Realmente es una tabla. Aquí la tenéis mejor hecha:
Moraleja: Cualquier cosa no es visualizar datos

Pros:
LA librería por excelencia
Altísima personalización (Data-Driven Documents)

Pros:
d3 sencillo

Contras:
Bajo nivel

Buen conocimiento de Javascript & co

Pros:
Poca curva de aprendizaje desde R
Crear interacciones es muy sencillo

Contras:
Sólo visualizaciones con servidor
Shiny server Pro para despliegues importantes

Pros:
Con servidor o sin servidor
Adaptada para Big Data (Downsampling & Canvas)
Librerías en R, Python, Julia, Scala...
Mucha flexibilidad (3 niveles de API)

Contras:
Documentación en construcción

Conversación realficticia

Que guay este superproyecto con _empresa molona_ con _muchos_ GB de datos. Pero hago una gráfica de puntos  con una opacidad del 0.000001% por punto y tarda UNA HORA

¿Para qué queréis ese diagrama de puntos?

Es que tenemos más de dos variables.

:-| Ya... Bueno, ¿en qué terminal lo estáis reproduciendo?

Una tostadora con llamas a los lados y corriendo Windows 95

Ajá... Podéis hacer una rejilla y hacer un mapa de calor [downsampling]

¡¡Pero entonces no es sexy!!

¿Y si agrupáis los sujetos por proximidad? [downsampling II]

¡¡Pero entonces no es Big Data!!

Factores clave para elegir herramienta

¿Tiene que ser offline?

¿Cantidad de datos? ¿CPU?

Tiempo

(Quieren decir dinero)

Datos estáticos / dinámicos

Equipo(lenguajes y código heredado)

Shiny

NVD3, Bokeh, dimple

D3, NVD3, rCharts

Bokeh

D3

Shiny, dimple, rCharts

rCharts

Shiny, Bokeh, D3

Shiny, MPLD3

Los verdaderos puntos fuertes

Enlazado o Linking

  • Existe enlazado de ejes: "todos los ejes se mueven a la vez"
  • Enlazado de selección: "la selección en una gráfica se selecciona en otra"

Ayuda a explorar alta dimensionalidad

Análisis detallado de outliers o concentraciones

Los verdaderos puntos fuertes

Interactividad

  • Puede ser sencilla, por ejemplo: zoom y selección
  • Avanzada: con widgets. Inputs de parámetros o manipular datos
  • Casos típicos: filtrar entidades y cambiar variables

Útil en contextos con interacciones complejas entre variables
Permites al usuario explorar los datos de forma autónoma
(te ahorras hacer mil gráficas)

Los verdaderos puntos fuertes

Animación

  • Puede estar basada en servidor o en cliente ¡cuidado con la latencia!
  • Ayuda en contextos de tiempo real
  • ¡Por fin una cuarta dimensión!

Muy útil para tiempo real

MUY útil para representar tiempo

Sexy "vs" Funcional

Esto...

es una tabla

Esto...

también

Sexy "vs" Funcional

Esto...

es un bonito salvapantallas

Sexy "vs" Funcional

y esto:

es Visualización de Datos (con mayúsculas, sí)

Muchas
gracias

¿Preguntas? =)

Alejandro Vidal

License with  CC BY-SA

Psicómetra & analista de datos
OWLMET

Introducción a las visualizaciones interactivas

By Doble Pensador

Introducción a las visualizaciones interactivas

Presentación breve para la Data Science Spain 2015. Demostración de las distintas librerías (con énfasis en R y Python) y ejemplos relevantes.

  • 1,440