"Patrie Galere": un caso di studio
Produrre un progetto di data journalism, dall'inizio alla fine
Jacopo Ottaviani
Corso di Data Driven Journalism
Scuola di Giornalismo Radiotelevisivo di Perugia
Roma, 7 giugno 2014
Il workflow
Il data journalism è un processo.
Case study: Patrie Galere
- Patrie Galere, dieci anni di morti nelle carceri italiane
-
Pubblicato su Il Fatto (bit.ly/pgalere) e The Guardian
I dati e le storie
- Domande di ricerca
- Raccolta dati
- Elaborazione
- Pulizia
- Visualizzazione
- Racconto
Patrie Galere – domande di ricerca
- Quanti detenuti sono morti negli ultimi dieci anni in carcere?
- Quali sono le principali cause di morte? (e.g., suicidio, malattia, etc.)
- Quali sono gli istituti penitenziari che versano nelle condizioni più critiche?
- Tracciare una demografia del fenomeno? Età, genere, provenienza.
-
È possibile dare una visione d'insieme del fenomeno?
Un dataset visualizzato su
una mappa interattiva
Può rispondere alle nostre domande in un colpo solo.
Patrie Galere, raccolta dati
Fonte di dati (dataset): Associazione Ristretti Orizzonti - ristretti.it
Come trovare dati?
Google, Con trucchi: http://www.googleguide.com/cheatsheet.html
ISTAT
Governi & ministeri
Regioni, provincie, comuni (open data)
Associazioni & O.N.G.
Istituti di ricerca pubblici e privati (e.g. EURES)
Tutto ciò relativo al dominio di ricerca (e.g. carceri)
oppure
Raccogliere i dati ex novo
(ma può essere molto complesso e impegnativo)
Cos'è un dataset, nel concreto
Che significa «raffinare» i dati?
- Il nostro obiettivo è quello di migliorare il dataset affinché sia:
-
Significativo rispetto alle nostre domande di ricerca
-
Leggibile per il nostro software di visualizzazione (CSV funziona quasi sempre)
-
Geolocalizzabile (x mappe interattive), i.e. con una colonna location (e.g. regione o città) o coordinate lat/lon
-
Leggero e corretto, i.e. privo di info inutili o errori
- Per raffinare i dati si può usare Excel o OpenRefine, che aiutano ad automatizzare o velocizzare questo processo.
CSV
Formato .CSV = Comma Separated Values
C'è anche .TSV = Tab Separated Values
Visualizzazione (mappatura)
Free – se avete meno di 250 record (righe) nel dataset (tabella)
Formato accettato: TSV (tab separated values)
Mappatura e racconto
Grazie!
Domande?
Jacopo Ottaviani