"Patrie Galere": un caso di studio

Produrre un progetto di data journalism, dall'inizio alla fine



Jacopo Ottaviani



Corso di Data Driven Journalism
Scuola di Giornalismo Radiotelevisivo di Perugia
Roma, 7 giugno 2014

Il workflow

Il data journalism è un processo.

Case study: Patrie Galere

  • Patrie Galere, dieci anni di morti nelle carceri italiane 
  • Pubblicato su Il Fatto (bit.ly/pgalere) e The Guardian

I dati e le storie

  1. Domande di ricerca 
  2. Raccolta dati
  3. Elaborazione
  4. Pulizia
  5. Visualizzazione
  6. Racconto


Patrie Galere – domande di ricerca


  • Quanti detenuti sono morti negli ultimi dieci anni in carcere?

  • Quali sono le principali cause di morte? (e.g., suicidio, malattia, etc.) 

  • Quali sono gli istituti penitenziari che versano nelle condizioni più critiche?

  • Tracciare una demografia del fenomeno? Età, genere, provenienza.

  • È possibile dare una visione d'insieme del fenomeno?




Un dataset visualizzato su

una mappa interattiva


Può rispondere alle nostre domande in un colpo solo.

Patrie Galere, raccolta dati

            
              Fonte di dati (dataset): 
            Associazione Ristretti Orizzonti - ristretti.it

Come trovare dati?

  • Google, Con trucchihttp://www.googleguide.com/cheatsheet.html
  • ISTAT
  • Governi & ministeri
  • Regioni, provincie, comuni (open data)
  • Associazioni &  O.N.G.
  • Istituti di ricerca pubblici e privati (e.g. EURES)
  • Tutto ciò relativo al dominio di ricerca (e.g. carceri)

  • oppure

    Raccogliere i dati ex novo 
    (ma può essere molto complesso e impegnativo)

    Cos'è un dataset, nel concreto

    Che significa «raffinare» i dati?


      • Il nostro obiettivo è quello di migliorare il dataset affinché sia:

        • Significativo rispetto alle nostre domande di ricerca

        • Leggibile per il nostro software di visualizzazione (CSV funziona quasi sempre)

        • Geolocalizzabile (x mappe interattive), i.e. con una colonna location (e.g. regione o città) o coordinate lat/lon

        • Leggero e corretto, i.e. privo di info inutili o errori

      • Per raffinare i dati si può usare Excel o OpenRefine, che aiutano ad automatizzare o velocizzare questo processo.

    Geolocalizzazione


    Pulizia



    Alleggerimento



    CSV

    Formato .CSV = Comma Separated Values

    C'è anche .TSV = Tab Separated Values

    Visualizzazione (mappatura)

    Si può usare questa applicazione > batchgeo.com/en/











    Free – se avete meno di 250 record (righe) nel dataset (tabella)
    Formato accettato: TSV (tab separated values)

    Mappatura e racconto






    Grazie! 

    Domande?



    Jacopo Ottaviani
    Made with Slides.com