Introduzione al Data Journalism

Raccontare storie guidati da numeri, tabelle e infografiche


Andrea Nelson Mauro



Corso di Data Driven Journalism
Scuola di Giornalismo Radiotelevisivo di Perugia
Roma, 7 giugno 2014

Dataninja.it

Il sito di Dataninja con i nostri progetti principali

Datamediahub.it

È un osservatorio sui media, sul giornalismo e la comunicazione

school.dataninja.it

Informazioni, slides, esperimenti, tutorial e tool per i data journalist

http://bit.ly/ddjroma

Il data journalism

Una storia che viene da lontano

There was 5 exabytes of information created between the dawn of civilization through 2003, but that much information is now created every 2 days, and the pace is increasing (Eric Schmidt)

Il primo uso del computer a fini giornalistici risale al 1952 negli USA: nasce il C.A.R. (Computer Assisted Reporting).

Nel 1967 Philip Meyer consacra questa pratica con un’inchiesta di successo (1968: A Newspaper's Role Between the Riots).

Nel 1973 Meyer stesso fonda il giornalismo di precisione, coniugando tecnologia e metodo scientifico (Giornalismo e metodo scientifico).

Con l'accento sulla j

Il vecchio e caro giornalismo, ma con numeri e tabelle



Quest'anno hanno partecipato 520 progetti, ridotti a 75 dopo la prima selezione (tre italiani): i vincitori finali saranno solo 8.

Peculiarità del data journalism


Ingredienti:
  • disponibilità di dati quantitativi (numeri o roba misurabile)
  • possibilità di processarli e analizzarli (viva i calcolatori)
  • metodo scientifico (mica per altro, è che funziona)
  • onestà intellettuale (anche nota come deontologia professionale)
  • fiuto per la notizia
  • competenze narrative (non solo l'italiano, ma anche forme e colori)

Da giornalisti, dobbiamo sempre raccontare storie...

... ormai sempre più basate su dati digitali!

Peculiarità del data journalism


Richiede competenze multi-disciplinari e quindi team di professionisti:
  • giornalista
  • data scientist / statistico
  • sviluppatore
  • designer / grafico

Porta facilmente a prodotti giornalistici di lunga vita o a temi su cui tornare a più riprese.

Ci sono ampie libertà di riutilizzo e riciclo.

Il rilascio dei dati permette di costruire comunità attorno ad essi: non solo giornalismo informativo, quindi, ma anche di servizio.

Limiti del data journalism


Richiede molta accortezza nell'uso degli strumenti statistici.

Si rischiano prodotti giornalistici “belli”, ma fini a se stessi.

Spesso è necessario imparare a usare software con curve di apprendimento abbastanza ripide.

Gli strumenti e le piattaforme cambiano molto velocemente e bisogna rimanere aggiornati.

Spesso si usano servizi di terze parti di cui non si ha il controllo.

Tutti quelli del giornalismo...

Temi, tipologie e mezzi


Non c'è limite ai temi che si possono affrontare: sociale, politico, scientifico, economico, sportivo, persino gossip...

La ricerca con metodo è un approccio tipico del giornalismo d'inchiesta, ma si sposa bene anche con quello di cronaca, il reportage, persino l'intervista...

Il racconto e la visualizzazione dei dati si esprimono al meglio su web, ma possono essere molto efficaci anche sulla carta, nel foto e video giornalismo, in tv e alla radio...

È più una questione di metodo e materie prime che di temi, specializzazioni, ambienti, media...

Il processo di produzione

La teoria delle quattro fasi

Mi imbatto in un insieme di dati e sento il profumo di una possibile notizia: li raccolgo, li analizzo, faccio delle ipotesi, le verifico...
scopro la notizia.
Trovare
Pulire
Analizzare
Raccontare

Le fonti di dati

Dove cercare e come capire di aver trovato

Tipo di dati:
  • non strutturati;
  • strutturati (con metadati).


Titolarità e diritti di riutilizzo:
  • open data (opendefinition.org);
  • copyright;
  • privacy, diritto all'oblio, segreto statistico, ...

Accesso ai dati:

Le fonti di dati

Dove cercare e come capire di aver trovato

Formato dei dati digitali:
  • pdf,
  • pagine web in html,
  • csv,
  • fogli di calcolo (xls, xlsx, ods),
  • database,
  • end-point interrogabili.

Per essere utili devono essere machine readable: non dobbiamo leggerli noi, ma farli leggere alle macchine!

L'arte dello scraping: DataMiner & Co.


La pulizia dei dati

Verificare, individuare errori, correggere

Premesse sbagliate portano (quasi) sempre a conclusioni sbagliate, anche se il ragionamento è corretto.

Pure se affidabile, anche la fonte può sbagliare. Così come può barare, truccare, mentire, nascondere, omettere, ecc.

Da controllare sempre prima di tutto:
  • coerenza interna,
  • completezza,
  • verosimiglianza.

Non buttar via mai niente e tenere traccia di quello che si fa...

La pulizia dei dati

Verificare, individuare errori, correggere

Strumenti dei fogli di calcolo:
  • filtri e funzioni di ordinamento;
  • formattazione condizionale;
  • definizione esplicita dei tipi (stringa, numero, data, ...);
  • semplici grafici.

Uno strumento ad hoc: Open Refine (openrefine.org).


Analizzare i dati e ricercare notizie

Interrogare i dati e andare oltre i numeri

Ingredienti:
  • fiuto (e occhio);
  • esperienza;
  • propensione al dubbio q.b.;
  • un pizzico di statistica e matematica.

Preparazioni di base:
  • normalizzazione;
  • variazione;
  • distribuzione;
  • correlazione;
  • filtro, ordinamento, aggregazione.

Analizzare i dati e ricercare notizie

Alcuni spunti e tracce di lavoro

Confronto - Dati sulla disoccupazione o sui costi dei servizi: quelli della tua città/regione sono più alti o più bassi rispetto ad altri territori?
Periodi lunghi - Le fonti ufficiali tendono a concentrarsi su dati del quarto trimestre. Il contesto e la prospettiva cambiano osservando dati che mostrano lo sviluppo di un fenomeno negli ultimi 5 o 10 anni. 
Pro capite - Un'istituzione annuncia milioni di euro di investimenti per le scuole. Ma hai fatto qualche conto? Quanti studenti potranno beneficiarne, su quale periodo di tempo? Ricalcolare il valore pro capite di programmi di investimento spesso può chiarire il reale significato.
Bilanci e modelli di raccolta - Prova ad eseguire semplici controlli di somme e totali. Verifica le modalità con le quali i dati sono stati raccolti e con quali ipotesi o modelli. Qual è il tasso di disoccupazione nel tuo paese? Controllalo e confrontalo con altri paesi o modelli alternativi.

Visualizzare i dati / Tools


Visualizzare i dati significa decidere come connetterli alle proprietà che definiscono forme geometriche ed elementi grafici

Principali strumenti visualizzazione:

Ma on line ci sono tantissimi altri strumenti: l'importante è avere chiaro il proprio obiettivo e non avere paura di sperimentare!

Visualizzare i dati / Dietro le quinte

Spesso visualizzare i dati può aiutarci a "scoprire" delle notizie


Suggerimento:
Quanto è grande la differenza del tasso di disoccupazione tra due o più territori? Com'è cambiato un fenomeno nel tempo?

Visualizzare questi dati può aiutarci a comprendere in maniera più immediata un fenomeno e fare prendere al nostro lavoro giornalistico un'altra direzione: torniamo indietro, cerchiamo altri dati, li mettiamo a confronto. 

La scrittura del pezzo

Raccontare i dati con grafici e parole

Occhiello
Titolo
Sommario
Attacco
Notizia
Corpo
Chiusa

Tutto come al solito, però questa volta abbiamo dati e numeri.

Li possiamo raccontare a parole oppure visualizzarli...

La scrittura del pezzo

Alcune considerazioni al riguardo


  • I nostri dati sono l'argomento principale della storia o sono funzionali a raccontarne una parte? (Ad esempio: stiamo facendo una ricerca su un territorio disagiato, e tra le varie informazioni raccogliamo e visualizziamo anche dati sulla disoccupazione, sugli investimenti, etc.)

  • Cosa aggiungono i dati rispetto alla nostra storia? Sono utili o servono per farci inserire un grafico interattivo e dare più "movimento" alla pagina?

Il futuro del giornalismo?

Ma anche no...


  • La distinzione tra data journalism e giornalismo tradizionale non ha senso di esistere... ma è servita a delineare un metodo di lavoro e a definire una comunità di professionisti, ora riconosciuta.


  • Gli strumenti, le tecniche e le metodologie del giornalismo sono ormai indispensabili in ogni redazione che si ponga l'obiettivo di affrontare il racconto della nostra realtà usando tutti i dati e le informazioni oggi disponibili.
Sicuramente l'analisi dati e la scoperta di notizie richiedono un'approccio metodologico lontano dal giornalismo d'opinione (non a caso il data journalism è un termine anglosassone).

Detto anche giornalismo di precisione, quantitativo, esplicativo, ...

Buon lavoro!


Andrea Nelson Mauro / "nelsonmau"
nelsonmau@dataninja.it

Dataninja

Newsletter

Datamediahub


Introduzione al data journalism | School.dataninja.it

By Dataninja srls

Introduzione al data journalism | School.dataninja.it

Lezione per giornalisti nell'ambito della formazione professionale continua presso la Scuola di Giornalismo Radiotelevisivo di Perugia. (Roma, 7 giugno 2014).

  • 3,814