Data Journalism: strumenti operativi

Mappature, infografiche e fact-checking


Andrea Nelson Mauro
@nelsonmau

www.dataninja.it


L’Ordine dei Giornalisti 
e la Fondazione Giornalisti dell’Emilia-Romagna
Bologna, Lunedì 9 giugno 2014

Dataninja.it

Il sito di Dataninja con i nostri progetti principali

Datamediahub.it

È un osservatorio sui media, sul giornalismo e la comunicazione

school.dataninja.it

Informazioni, slides, esperimenti, tutorial e tool per i data journalist

bit.ly/ddjbologna




Un'introduzione 

sul data journalism

Il contesto: le informazioni sul web


From the dawn of civilization until 2003, humankind generated five exabytes of data. Now we produce five exabytes every two days… and the pace is accelerating!


Eric Schmidt , Google’s executive chairman





Il data journalism
può servire
a muoversi
tra questi dati

Il data journalism

Una storia che viene da lontano

There was 5 exabytes of information created between the dawn of civilization through 2003, but that much information is now created every 2 days, and the pace is increasing (Eric Schmidt)

Il primo uso del computer a fini giornalistici risale al 1952 negli USA: nasce il C.A.R. (Computer Assisted Reporting).

Nel 1967 Philip Meyer consacra questa pratica con un’inchiesta di successo (1968: A Newspaper's Role Between the Riots).

Nel 1973 Meyer stesso fonda il giornalismo di precisione, coniugando tecnologia e metodo scientifico (Giornalismo e metodo scientifico).

Con l'accento sulla j

Il vecchio e caro giornalismo, ma con numeri e tabelle



Quest'anno hanno partecipato 520 progetti, ridotti a 75 dopo la prima selezione (tre italiani): i vincitori finali saranno solo 8.

Peculiarità del data journalism


Ingredienti:
  • disponibilità di dati quantitativi (numeri o roba misurabile)
  • possibilità di processarli e analizzarli (viva i calcolatori)
  • metodo scientifico (mica per altro, è che funziona)
  • onestà intellettuale (anche nota come deontologia professionale)
  • fiuto per la notizia
  • competenze narrative (non solo l'italiano, ma anche forme e colori)

Da giornalisti, dobbiamo sempre raccontare storie...

... ormai sempre più basate su dati digitali!

Peculiarità del data journalism


Richiede competenze multi-disciplinari e quindi team di professionisti:
  • giornalista
  • data scientist / statistico
  • sviluppatore
  • designer / grafico

  • Porta facilmente a prodotti giornalistici di lunga vita o a temi su cui tornare a più riprese.

  • Ci sono ampie libertà di riutilizzo e riciclo.

  • Il rilascio dei dati permette di costruire comunità attorno ad essi: non solo giornalismo informativo, quindi, ma anche di servizio.

Limiti del data journalism


  • Richiede molta accortezza nell'uso degli strumenti statistici.

  • Si rischiano prodotti giornalistici “belli”, ma fini a se stessi.

  • Spesso è necessario imparare a usare software con curve di apprendimento abbastanza ripide.

  • Gli strumenti e le piattaforme cambiano molto velocemente e bisogna rimanere aggiornati.

  • Spesso si usano servizi di terze parti di cui non si ha il controllo.


Temi, tipologie e mezzi


Non c'è limite ai temi che si possono affrontare: sociale, politico, scientifico, economico, sportivo, persino gossip...

La ricerca con metodo è un approccio tipico del giornalismo d'inchiesta, ma si sposa bene anche con quello di cronaca, il reportage, persino l'intervista...

Il racconto e la visualizzazione dei dati si esprimono al meglio su web, ma possono essere molto efficaci anche sulla carta, nel foto e video giornalismo, in tv e alla radio...

È più una questione di metodo e materie prime che di temi, specializzazioni, ambienti, media...

Il processo di produzione

La teoria delle quattro fasi

Mi imbatto in un insieme di dati e sento il profumo di una possibile notizia: li raccolgo, li analizzo, faccio delle ipotesi, le verifico...
scopro la notizia.
Trovare > Pulire > Analizzare > Raccontare

Le fonti di dati

Dove cercare e come capire di aver trovato

Tipo di dati:
  • non strutturati;
  • strutturati (con metadati).


Titolarità e diritti di riutilizzo:
  • open data (opendefinition.org);
  • copyright;
  • privacy, diritto all'oblio, segreto statistico, ...

Accesso ai dati:

Le fonti di dati

Dove cercare e come capire di aver trovato

Formato dei dati digitali:
  • Già utilizzabili, solo da pulire e controllare
    csv, fogli di calcolo (xls, xlsx, ods), database, end-point interrogabili
    Si possono usare Microsoft Excel e Libre Office Calc

  • Da estrarre con lo scraping 
    pagine web in html, pdf
    Per essere utili devono essere machine readable: non dobbiamo leggerli noi, ma farli leggere ai computer!
    L'arte dello scraping: DataMiner, XPATH, applicazioni sviluppate ad hoc con Python& Co.

Le fonti di dati: dati.gov.it


E' il principale motore di ricerca italiano che raccoglie gli Open Data di tutte le pubbliche amministrazioni del Paese (ottimo per ricercare singole istituzioni e/o territori)

Le fonti di dati: Istat.it


L'Istituto nazionale di statistica ha ampliato enormemente la frequenza di pubblicazione dei dati. E' la principale fonte di informazione generalista (ottima per ricerche tematiche).

Le fonti di dati: OpenDataHub.it


Anche questo è un motore di ricerca, come dati.gov.it, ma contiene il catalogo di open data non solo pubblici (efficace per chi cerca informazioni non soltanto da istituzioni).

Amministrazione trasparente?


Ogni amministrazione pubblica ha il dovere per legge di pubblicare una sezione "Amministrazione trasparente", all'interno della quale rilasciare i propri dati delle attività dell'ente. Se cerchi i dati di un ente, vai sul suo sito e cerca la sezione.


E adesso?

Pulire, 

analizzare, 

visualizzare

Pulizia dei dati: regole da rispettare

Verificare, individuare errori, correggere

Premesse sbagliate portano (quasi) sempre a conclusioni sbagliate, anche se il ragionamento è corretto.

Pure se affidabile, anche la fonte può sbagliare. Così come può barare, truccare, mentire, nascondere, omettere, ecc.

Da controllare sempre prima di tutto:
  • coerenza interna,
  • completezza,
  • verosimiglianza.

Non buttar via mai niente e tenere traccia di quello che si fa...

Pulizia dei dati: metodi e strumenti

Verificare, individuare errori, correggere

Strumenti dei fogli di calcolo (come Microsoft Excel, Libre Office Calc):
  • filtri e funzioni di ordinamento;
  • formattazione condizionale;
  • definizione esplicita dei tipi (stringa, numero, data, ...);
  • semplici grafici.

Si può fare con Microsoft Office o Libre Office Calc
Oppure con uno strumento ad hoc: Open Refine (openrefine.org).


Analizzare i dati e ricercare notizie

Alcuni spunti e tracce di lavoro

Confronto - Dati sulla disoccupazione o sui costi dei servizi: quelli della tua città/regione sono più alti o più bassi rispetto ad altri territori?
Periodi lunghi - Le fonti ufficiali tendono a concentrarsi su dati del quarto trimestre. Il contesto e la prospettiva cambiano osservando dati che mostrano lo sviluppo di un fenomeno negli ultimi 5 o 10 anni. 
Pro capite - Un'istituzione annuncia milioni di euro di investimenti per le scuole. Ma hai fatto qualche conto? Quanti studenti potranno beneficiarne, su quale periodo di tempo? Ricalcolare il valore pro capite di programmi di investimento spesso può chiarire il reale significato.
Bilanci e modelli di raccolta - Prova ad eseguire semplici controlli di somme e totali. Verifica le modalità con le quali i dati sono stati raccolti e con quali ipotesi o modelli. Qual è il tasso di disoccupazione nel tuo paese? Controllalo e confrontalo con altri paesi o modelli alternativi.

Visualizzare i dati / Tools


Visualizzare i dati significa decidere come connetterli alle proprietà che definiscono forme geometriche ed elementi grafici

Principali strumenti visualizzazione:

Ma on line ci sono tantissimi altri strumenti: l'importante è avere chiaro il proprio obiettivo e non avere paura di sperimentare!

Visualizzare i dati / Datawrapper.de


Con Datawrapper è possibile realizzare grafici interattivi in pochi minuti (grafici a barre, torte, istogrammi, grafici a linee, e qualche mappa)

Visualizzare i dati / CartoDB


CartoDB permette di creare mappe interattive in pochi istanti. L'importante è che la tua tabella abbia dei dati geografici.

Visualizzare i dati / RAW


RAW permette di gestire bene le relazioni tra i dati e la loro gerarchia. E' facile da usare provando gli esempi già presenti (esempio di quali ingredienti sono fatti i cocktail?).

Visualizzare i dati / Timeline


Costruire una cronistoria degli eventi può essere molto utile. Si può fare con Timeline.JS, ad esempio inserendo in una tabella vari articoli in successione temporale (guarda la timeline del terremoto in Emilia).

Visualizzare i dati / Network Analysis


Quali sono le relazioni tra i dati? E' possibile visualizzarle con GEPHI, un software di Networl Analysis (basato sui grafi). E' spesso usato per vedere le connessioni tra gli utenti su Twitter o le amicizie su Facebook.

Visualizzare i dati / Dietro le quinte

Spesso visualizzare i dati può aiutarci a "scoprire" delle notizie


Suggerimento:
Quanto è grande la differenza del tasso di disoccupazione tra due o più territori? Com'è cambiato un fenomeno nel tempo?

Visualizzare questi dati può aiutarci a comprendere in maniera più immediata un fenomeno e fare prendere al nostro lavoro giornalistico un'altra direzione: torniamo indietro, cerchiamo altri dati, li mettiamo a confronto. 

Il Fact-checking: che cos'è?


Verificare le informazioni in maniera approfondita (comunicati stampa, dichiarazioni dei politici). Si sta diffondendo enormemente in relazione all'aumento della quantità di informazioni disponibili sul web.

Un esempio: pagellapolitica.it

Con i dati il Fact-checking è semplice!


Le best practices del Data Journalism prevedono che insieme alle inchieste vengano pubblicati i dati relativi, per permettere di verificare le visualizzazioni e i risultati. Noi abbiamo costruito dati.dataninja.it

Il futuro del giornalismo?

Ma anche no...


  • La distinzione tra data journalism e giornalismo tradizionale non ha senso di esistere... ma è servita a delineare un metodo di lavoro e a definire una comunità di professionisti, ora riconosciuta.


  • Gli strumenti, le tecniche e le metodologie del giornalismo sono ormai indispensabili in ogni redazione che si ponga l'obiettivo di affrontare il racconto della nostra realtà usando tutti i dati e le informazioni oggi disponibili.
Sicuramente l'analisi dati e la scoperta di notizie richiedono un'approccio metodologico lontano dal giornalismo d'opinione (non a caso il data journalism è un termine anglosassone).

Detto anche giornalismo di precisione, quantitativo, esplicativo, ...

Buon lavoro!


Andrea Nelson Mauro / "nelsonmau"
nelsonmau@dataninja.it
@nelsonmau

Dataninja
www.dataninja.it
http://school.dataninja.it

Newsletter
http://dataninja.it/newsletter

Datamediahub
http://datamediahub.it


Made with Slides.com