Dati e giornalismo

Raccontare i fatti e il loro contesto sociale e ambientale attraverso i dati per aumentare le conoscenze e favorire le scelte dei cittadini

Alessio Cimarelli

alessio@dataninja.it

 

..:: http://dtnj.it/odd18fe ::..

Open Data Day 2018

Ferrara, 3 marzo 2018

Prima di cominciare

Signup to carto.com

Data journalism

Le competenze

Giornalismo - Fiuto per la notizia, attenzione all'interesse pubblico, intuito basato sulla conoscenza del contesto

Data science / statistica - Approccio analitico, competenze matematiche e statistiche, intuito basato sulle scienze quantitative

Design - Sensibilità e intuizione artistiche, conoscenza di teorie e tecniche di architettura dell'informazione  e di User Experience

Sviluppo software / hacking - Capacità di problem solving, competenze digitali, un po' di sano spirito nerd

Data journalism

Il calcio d'inizio

Si parte da una domanda di ricerca, una curiosità, una notizia d'attualità e si cercano i dati per approfondire e costruire una narrazione data-driven.

Ci si imbatte in un set di dati o lo si riceve da una qualche fonte, si scava a fondo per scoprire una notizia e poi raccontarla.

Data journalism

Le quattro fasi

Trovare i dati - Motori di ricerca pubblici o deep web? Open data istituzionali o web scrapers?

Controllo, verifica e pulizia - I dati da elaborare devono essere leggibili per la macchina, non per gli uomini! E i dataset possono nascondere errori, menzogne...

Raccontarli e visualizzarli - Come rappresentare visivamente e interattivamente numeri e relazioni tra quantità?

Analizzare i dati - Normalizzazioni, confronti, filtri, raggruppamenti, aggregazioni, correlazioni, ...

Disuguaglianze in salute

Tre contesti

Dati di contesto sociale, demografico, economico, ...

Dati epidemiologici: quali malattie, chi colpiscono, quando, dove, ...

Dati dell'offerta sanitaria: chi si cura, dove e come, ...

Il contesto economico

L'offerta sanitaria

I presidi per gli anziani

  1. I confini provinciali dell'Emilia-Romagna: OpenDataER.
    1. File zip con i soli file V_PRV_GPG.*
  2. Popolazione ultra 65-enne e indice di invecchiamento: ReportER SISEPS.
    1. CSV con ";" come separatore
    2. Eliminazione intestazioni e piè di pagina
    3. Aggiunta colonna "Sigla"
    4. Esportazione CSV ripulito (il punto come separatore dei decimali)

L'offerta sanitaria

I presidi per gli anziani

  1. I presidi socio-assistenziali dell'Emilia-Romagna: OpenDataER (target: "Anziani").
    1. Esporta in CSV (1018 presidi)
  2. Geocodifica degli indirizzi
    1. Aggiunta indirizzo completo: "indirizzo, comune, provincia, Emilia-Romagna, Italia"
  1. Log in su carto.com
  2. Cliccare su "New map" -> "Connect dataset"
  3. Caricare il file "provincev2 - RIPULITO.zip"
  4. Cliccare su "Add new layer" > "Connect dataset"
  5. Caricare il file "SanitaPopolazione - Popolazione ultra 65enne - RIPULITO.csv"
  6. Cliccare su "Add layer"

L'offerta sanitaria

La mappa dei presidi

  1. Selezionare il layer "v_prv_gpg"
  2. Cliccare su "Analysis" > "Add a new analysis" > "Join columns from 2nd layer" > "Add analysis"
  3. Impostare "Target", "Key columns" (provincia e sigla) e "Target data" (tutte le colonne)
  4. Cliccare su "Apply" > "Style this analysis"

L'offerta sanitaria

La mappa dei presidi

  1. Cliccare su "Style" > "Color" > "By value"
  2. Scegliere "right_ind_invecchiamento_pop_65"
  3. Scegliere una scala cromatica a gradiente "rosso"
  4. Scegliere metodo "Jenks" e "5 buckets"
  5. Cliccare su "Pop-up" > "Light"
  6. Selezionare "right_provincia", "right_residenti_65", "right_ind_invecchiamento_pop_65"

L'offerta sanitaria

La mappa dei presidi

  1. Aggiungere un nuovo livello caricando il file CSV dei presidi per Anziani
  2. Cliccare su "Geocode"
  3. Scegliere "Street address" e le colonne "indirizzo", "comune", "provincia"
  4. Cliccare su "Confirm" (attenzione: limite di 250 indirizzi al giorno per la versione free)
  5. Impostare colori, dimensioni e pop-up

L'offerta sanitaria

La mappa dei presidi

L'offerta sanitaria

I dati sul reddito

  1. I confini comunali dell'Emilia-Romagna: OpenDataER.
    1. File zip con i soli file V_COM_2016_GPG.*
  2. Il reddito a livello comunale: Ministero delle Finanze.
    1. CSV con ";" come separatore
    2. Filtro per "Regione" = "Emilia Romagna"
    3. Calcolo "Reddito imponibile pro-capite" come "Reddito imponibile - Frequenza" / "Reddito imponibile - Ammontare"
    4. Esportazione CSV ripulito e arricchito

Il contesto economico

La mappa del reddito

  1. Log in su carto.com
  2. Cliccare su "New map" -> "Connect dataset"
  3. Caricare il file "V_COM_2016_GPG - RIPULITO.zip"
  4. Cliccare su "Add new layer" > "Connect dataset"
  5. Caricare il file "Redditi_e_principali_variabili_IRPEF_su_base_comunale_CSV_2015 - Emilia-Romagna.csv"
  6. Cliccare su "Add layer"

Il contesto economico

  1. Selezionare il layer "v_com_2016_gpg_1"
  2. Scegliere la visualizzazione "Data"
  3. Selezionare la colonna "istat", scegliere "Change data type" > "Number"
  4. Cliccare su "Analysis" > "Add a new analysis" > "Join columns from 2nd layer" > "Add analysis"
  5. Impostare "Target", "Key columns" (istat) e "Target data" (tutte le colonne)
  6. Cliccare su "Apply" > "Style this analysis"

La mappa del reddito

Il contesto economico

  1. Cliccare su "Style" > "Color" > "By value"
  2. Scegliere "right_reddito_imponibile_pro_capite"
  3. Scegliere una scala colore "rosso -> blu"
  4. Scegliere metodo "Jenks" e "7 buckets"
  5. Cliccare su "Pop-up" > "Light"
  6. Selezionare "Denominazione comune", "Codice provincia", "Reddito pro-capite"

La mappa del reddito

Il contesto economico

Il contesto economico

Open Data Day 2018

Ferrara, 3 marzo 2018

Grazie!

Made with Slides.com