Taller de dades

Eva Domínguez - dominguez.eva@gmail.com

 David Martín-Borregón - david@datanpress.com

 Arnau Udina - arnau@datanpress.com

Què farem?

 

  • Com treballar amb dades
  • La visualització de dades amb mapes
  • Exercicis amb CartoDB i Quadrigam
    (treballs en grups)

Què farem?

 

  • Matí
    • Introducció
    • Exercicis 0
    • Cafè
    • Exercicis 1 i 2
  • Tarda
    • Exercicis 3 i 4
    • Tancament

Com treballar amb dades

  • Objectiu de les visualitzacions
  • Com preparar el full de càlcul

Objectiu de les visualitzacions

  • Ús intern, extern?
  • Si han de ser publicables, a qui ens dirigim?
    • Eina per a periodistes, investigadors?
    • Explicar els termes tècnics
    • Incloure dades interessants

Com preparar el full de càlcul

  • Qüestions de format
    • Preparar les capçaleres (sense disseny)
    • Dades consistents (tot números, tot text...)
  • Revisar i afegir dades
    • Dades de població
    • Sense ajustar
    • Percentatges reals
    • Llegendes
    • Que no faltin dades sense justificació
    • Mai hi ha massa dades (millor que sobrin)

Visualització amb mapes

  • Exemples històrics
  • Tipus de mapes
  • Com preparar els fitxers

Una mica de història

John Snow - 1854

El Brot de còlera de Broad Street

Una mica de història

Florence Nightingale - 1855

Les causes de la mortalitat a la Guerra de Crimea

Tipus de mapes

  • Mapa de punts
  • Mapa de bombolles
  • Punts calents (heatmap)
  • Choropleth

  • Altres

Mapa de punts

Equip de CartoDB - 2015

Cada dada és un punt

  • Avantatge principal:
    • La informació és neta: cada historia és un punt.
    • Utilitzant colors es pot a mostrar una segona dimensió.

 

  • Desavantatge principal:
    • La sobreposició de punts pot amagar informació.

Mapa de punts

Cada dada és un punt

Mapa de bombolles

Els punts creixen amb una segona dimensió

Ben Wellington - 2014

Mapa de bombolles

Els punts creixen amb una segona dimensió

Equip de CartoDB - 2015

  • Avantatges:
    • Es pot mostrar una altre dada quantificada en el mateix mapa.

 

  • Desavantatges:
    • La sobreposició de punts pot amagar informació.
    • Als humans ens costa comparar àrees.

Mapa de bombolles

Els punts creixen amb una segona dimensió

Equip de CartoDB - 2015

Mapa de calor (heatmap)

Destacar la densitat

Mapa de calor (heatmap)

Destacar la densitat

  • Avantatges:
    • Permet veure patrons geogràfics de forma fàcil.
       
  • Desavantatges:
    • És complicat explorar les dades.

Choropleth

Mostrar regions, no punts

Choropleth

  • Avantatges
    • Permet veure patrons.
    • Permet localitzar peculiaritats.
       
  • Desavantatges
    • La mida de les àrees no és uniforme.
    • Àrees massa grans poden amagar informació a petita escala.

Altres mapes

Deformar les formes

Data'n'Press - 2015

Altres mapes

Deformar les formes

Five Thirty Eight

Altres mapes

Deformar les formes

Altres mapes

Mapes de punts que fan choropleths

Altres mapes

No  només geografia.

Altres mapes

Més enllà dels mapes

Exercicis

  • CartoDB

1. Choropleth. Fusionar dades d'excel amb CartoDB

2. Bombolles. Afegir una dada per representar proporcions

  •  Quadrigam

​3. Crear un diagrama de punts

4. Incorporació dels gràfics a una pàgina editable

Exercici 0

Familizaritzar-se amb CartoDB

Exercici 0

Familizaritzar-se amb CartoDB

 

  • Registrar-se: nom d'usuari, correu electrònic i clau.
  • Crear un mapa ("new empty map").
  • Afegir punts de tots els llocs on heu estat.

Exercici 0

Afegir punts dels llocs on heu estat,

a Barcelona, a Europa, o al món!

Exercici 0

Observar el Data View

  • Afegir una columna que es digui "primers"

Editar les 10 primers files amb un número 1

Exercici 0

Desde la vista de mapa ('map view') fer servir els wizards':

Fer un mapa de punts

amb categoria

O un 'heatmap'

Exercici 0

Personalitza el mapa:

Posa un títol, canvia el fons, posa anotacions, personalitza els colors, canvia les categories.

 

Comparteix el resultat final amb companys i amics amb el botó "publish".

Exercici 1

Choropleth: Fusionar dades d'excel amb CartoDB

Exercici 1

Descarregar les dades: http://bit.ly/24tRcAT

Preparar el full de càlcul:

  • Deixar només una capçalera.
  • Els noms de les columnes han de ser curts i entenedors.

Exercici 1

Els arxius de mapes:

  • .shp: Conté les formes (shapes) del mapa.
  • .dbf: Conté els atributs de les formes, per exemple el nom del ABS.
  • .shx: Organitza les formes.
  • .prj: Descriu com va la projecció, on posar les formes en un mapa.

Exercici 1

Connectar l'excel:

  • Des del menú principal anar a Datasets.
  • Clicar a 'Connect Dataset'.
  • Pujar l'arxiu excel.

Exercici 1

Connectar el 'shapefile':

  • Posar tots els arxius en un fitxer .zip.
  • Clicar a fer nou mapa.
  • Clicar a Connect Dataset.
  • Pujar l'arxiu .zip.
  • Connectar el 'dataset'.

Exercici 1

Unir els dos fitxers

  • Anar a 'Data View' d'un dels dos arxius.
  • Clicar a edit -> 'Merge with dataset'
  • Indicar la columna d'unió. Atenció al tipus de dada!

Exercici 1

Unir els dos fitxers:

  • Mirar el 'Data View'.
  • Tenim totes les columnes juntes!
  • Map view->Wizard->category->codi RS

Exercici 1

Fer el choropleth:

  • Map view->Wizard->choropleth-> [escollir indicador]

Exercici 1

Personalitzar les finestres d'informació ('infowindows')

Opcional:

Aconseguir posar un % al final de la xifra

Aconseguir mostrar dos decimals només [difícil]

Exercici 1

Fer el choropleth:

  • Personalitzar:
    • Infowindows
    • Colors
    • Fons
    • Compartir

Exercici 2

Mapa de bombolles: Representar valors absoults

Exercici 2

Afegim una columna a l'excel:

  • Nombre absolut de persones exemptes de copagament. (o algun altre nombre absolut)

  • =ROUND(%gent exempte * població assignada al ABS)

Exercici 2

Fem un nou mapa, igual que abans,

Aquest ha de usar l'excel amb la columna sola.

Exercici 2

I si no vull carregar l'Excel cada cop?

SELECT ROUND(Nombre_... * persones_exc...), *

SQL

Exercici 2

Recordem el 'infowindow' d'abans?

SELECT ROUND(percent_persones_exc..., 2), *

SQL

Així podem fer una columna nova només amb dos decimals que mostrarem al infowindow.

Exercici 2

Ara fem un mapa de bombolles

A 'composite operation' fem: 'multiply'

Així el mapa de bombolles fa efecte the mapa de calor 

Exercici 2

Per més opcions:

  • Pregunteu
  • Busqueu

Exercici 3

  • Registreu-vos (necessitareu un compte Google).
  • Fer un projecte nou.
  • Importar la taula d'excel.

 

Quadrigram: Gràfics interactius

Exercici 3

  • Charts -> Scatter plot
  • Arrossegar "Mortalitat prematura" a "Values at X"
  • Arrossegar "% població de 25 a..." a "Values at y"

 

Exercici 3

  • Arrastrar el nombre de habitants al radi.
  • Disminuir els dos radis per evitar el solapament.

 

Exercici 3

  • Fill color of each point -> colors by category.
  • Arrossegar 'descripció Rs' i triar llegenda de colors.
  • Posar l''outline thickness a 1px'

Po

Exercici 3

  • Donar nom als eixos

Exercici 3

Al 'tooltip' afegir l'ABS com a títol i la RS com a descripció

Exercici 3

  • Controls -> Legend
  • Outputs-> ScatterPlot
  • Arrosegar "colors of Categories" al Legend control

Exercici 3

Publiquem

Exercici 4

Quadrigram + CartoDb: Fer un infogràfic

Exercici 4

Com afegir un CartoDB?

  • CartoDB: publish-> embedded -> copiar url
  • Quadrigram: media-> iframe -> enganxar url

Copiar la URL! no el codi HTML

I ara què?

  • Els mapes són bons per mostrar patrons territorials 
  • No sempre la informació geogràfica ha de predominar. Hi ha d'altres opcions.

Quin és el tema que ha ocupat més temps al Parlament

Data'n'press - 2015

Mencions a twitter durant les jornades de periodisme de dades 2013

Data'n'press - 2013

Simulació de com les vacunes protegueixen les comunitats.

The Guardian - 2015 

200 països, 200 anys, 4 minuts

Hans Rosling - 2009 

Gràcies