Data Journalism: strumenti operativi
Mappature, infografiche e fact-checking
Andrea Nelson Mauro
L’Ordine dei Giornalisti
e la Fondazione Giornalisti dell’Emilia-Romagna
Bologna, Lunedì 9 giugno 2014
Dataninja.it
Il sito di Dataninja con i nostri progetti principali
Datamediahub.it
È un osservatorio sui media, sul giornalismo e la comunicazione
school.dataninja.it
Informazioni, slides, esperimenti, tutorial e tool per i data journalist
bit.ly/ddjbologna
Un'introduzione
sul data journalism
Il contesto: le informazioni sul web
From the dawn of civilization until 2003, humankind generated five exabytes of data. Now we produce five exabytes every two days… and the pace is accelerating!
Eric Schmidt , Google’s executive chairman
Il data journalism
può servire
a muoversi
tra questi dati
Il data journalism
Una storia che viene da lontano
There was 5 exabytes of information created between the dawn of civilization through 2003, but that much information is now created every 2 days, and the pace is increasing (Eric Schmidt)
Con l'accento sulla j
Il vecchio e caro giornalismo, ma con numeri e tabelle
Quest'anno hanno partecipato 520 progetti, ridotti a 75 dopo la prima selezione (tre italiani): i vincitori finali saranno solo 8.
Peculiarità del data journalism
Ingredienti:
-
disponibilità di dati quantitativi (numeri o roba misurabile)
-
possibilità di processarli e analizzarli (viva i calcolatori)
-
metodo scientifico (mica per altro, è che funziona)
-
onestà intellettuale (anche nota come deontologia professionale)
-
fiuto per la notizia
-
competenze narrative (non solo l'italiano, ma anche forme e colori)
Da giornalisti, dobbiamo sempre raccontare storie...
... ormai sempre più basate su dati digitali!
Peculiarità del data journalism
Richiede competenze multi-disciplinari e quindi team di professionisti:
-
giornalista
-
data scientist / statistico
-
sviluppatore
-
designer / grafico
-
Porta facilmente a prodotti giornalistici di lunga vita o a temi su cui tornare a più riprese.
-
Ci sono ampie libertà di riutilizzo e riciclo.
- Il rilascio dei dati permette di costruire comunità attorno ad essi: non solo giornalismo informativo, quindi, ma anche di servizio.
Limiti del data journalism
-
Richiede molta accortezza nell'uso degli strumenti statistici.
-
Si rischiano prodotti giornalistici “belli”, ma fini a se stessi.
-
Spesso è necessario imparare a usare software con curve di apprendimento abbastanza ripide.
-
Gli strumenti e le piattaforme cambiano molto velocemente e bisogna rimanere aggiornati.
-
Spesso si usano servizi di terze parti di cui non si ha il controllo.
Temi, tipologie e mezzi
Non c'è limite ai temi che si possono affrontare: sociale, politico, scientifico, economico, sportivo, persino gossip...
La ricerca con metodo è un approccio tipico del giornalismo d'inchiesta, ma si sposa bene anche con quello di cronaca, il reportage, persino l'intervista...
Il racconto e la visualizzazione dei dati si esprimono al meglio su web, ma possono essere molto efficaci anche sulla carta, nel foto e video giornalismo, in tv e alla radio...
È più una questione di metodo e materie prime che di temi, specializzazioni, ambienti, media...
Il processo di produzione
La teoria delle quattro fasi
Mi imbatto in un insieme di dati e sento il profumo di una possibile notizia: li raccolgo, li analizzo, faccio delle ipotesi, le verifico...
scopro la notizia.
Trovare > Pulire > Analizzare > Raccontare
Le fonti di dati
Dove cercare e come capire di aver trovato
Tipo di dati:
- non strutturati;
- strutturati (con metadati).
Titolarità e diritti di riutilizzo:
- open data (opendefinition.org);
- copyright;
- privacy, diritto all'oblio, segreto statistico, ...
Accesso ai dati:
Le fonti di dati
Dove cercare e come capire di aver trovato
Formato dei dati digitali:
- Già utilizzabili, solo da pulire e controllare
csv, fogli di calcolo (xls, xlsx, ods), database, end-point interrogabili
Si possono usare Microsoft Excel e Libre Office Calc
-
Da estrarre con lo scraping
pagine web in html, pdf
Per essere utili devono essere machine readable: non dobbiamo leggerli noi, ma farli leggere ai computer!
L'arte dello scraping: DataMiner, XPATH, applicazioni sviluppate ad hoc con Python& Co.
Le fonti di dati: dati.gov.it
E' il principale motore di ricerca italiano che raccoglie gli Open Data di tutte le pubbliche amministrazioni del Paese (ottimo per ricercare singole istituzioni e/o territori)
Le fonti di dati: Istat.it
L'Istituto nazionale di statistica ha ampliato enormemente la frequenza di pubblicazione dei dati. E' la principale fonte di informazione generalista (ottima per ricerche tematiche).
Le fonti di dati: OpenDataHub.it
Anche questo è un motore di ricerca, come dati.gov.it, ma contiene il catalogo di open data non solo pubblici (efficace per chi cerca informazioni non soltanto da istituzioni).
Amministrazione trasparente?
Ogni amministrazione pubblica ha il dovere per legge di pubblicare una sezione "Amministrazione trasparente", all'interno della quale rilasciare i propri dati delle attività dell'ente. Se cerchi i dati di un ente, vai sul suo sito e cerca la sezione.
E adesso?
Pulire,
analizzare,
visualizzare
Pulizia dei dati: regole da rispettare
Verificare, individuare errori, correggere
Premesse sbagliate portano (quasi) sempre a conclusioni sbagliate, anche se il ragionamento è corretto.
Pure se affidabile, anche la fonte può sbagliare. Così come può barare, truccare, mentire, nascondere, omettere, ecc.
Da controllare sempre prima di tutto:
- coerenza interna,
- completezza,
- verosimiglianza.
Non buttar via mai niente e tenere traccia di quello che si fa...
Pulizia dei dati: metodi e strumenti
Verificare, individuare errori, correggere
Strumenti dei fogli di calcolo (come Microsoft Excel, Libre Office Calc):
- filtri e funzioni di ordinamento;
- formattazione condizionale;
- definizione esplicita dei tipi (stringa, numero, data, ...);
- semplici grafici.
Si può fare con Microsoft Office o Libre Office Calc
Analizzare i dati e ricercare notizie
Alcuni spunti e tracce di lavoro
Confronto - Dati sulla disoccupazione o sui costi dei servizi: quelli della tua città/regione sono più alti o più bassi rispetto ad altri territori?
Periodi lunghi - Le fonti ufficiali tendono a concentrarsi su dati del quarto trimestre. Il contesto e la prospettiva cambiano osservando dati che mostrano lo sviluppo di un fenomeno negli ultimi 5 o 10 anni.
Pro capite - Un'istituzione annuncia milioni di euro di investimenti per le scuole. Ma hai fatto qualche conto? Quanti studenti potranno beneficiarne, su quale periodo di tempo? Ricalcolare il valore pro capite di programmi di investimento spesso può chiarire il reale significato.
Bilanci e modelli di raccolta - Prova ad eseguire semplici controlli di somme e totali. Verifica le modalità con le quali i dati sono stati raccolti e con quali ipotesi o modelli. Qual è il tasso di disoccupazione nel tuo paese? Controllalo e confrontalo con altri paesi o modelli alternativi.
Visualizzare i dati / Tools
Visualizzare i dati significa decidere come connetterli alle proprietà che definiscono forme geometriche ed elementi grafici
Principali strumenti visualizzazione:
Ma on line ci sono tantissimi altri strumenti: l'importante è avere chiaro il proprio obiettivo e non avere paura di sperimentare!
Visualizzare i dati / Datawrapper.de
Con Datawrapper è possibile realizzare grafici interattivi in pochi minuti (grafici a barre, torte, istogrammi, grafici a linee, e qualche mappa)
Visualizzare i dati / CartoDB
CartoDB permette di creare mappe interattive in pochi istanti. L'importante è che la tua tabella abbia dei dati geografici.
Visualizzare i dati / RAW
RAW permette di gestire bene le relazioni tra i dati e la loro gerarchia. E' facile da usare provando gli esempi già presenti (esempio di quali ingredienti sono fatti i cocktail?).
Visualizzare i dati / Timeline
Costruire una cronistoria degli eventi può essere molto utile. Si può fare con Timeline.JS, ad esempio inserendo in una tabella vari articoli in successione temporale (guarda la timeline del terremoto in Emilia).
Visualizzare i dati / Network Analysis
Quali sono le relazioni tra i dati? E' possibile visualizzarle con GEPHI, un software di Networl Analysis (basato sui grafi). E' spesso usato per vedere le connessioni tra gli utenti su Twitter o le amicizie su Facebook.
Visualizzare i dati / Dietro le quinte
Spesso visualizzare i dati può aiutarci a "scoprire" delle notizie
Suggerimento:
Quanto è grande la differenza del tasso di disoccupazione tra due o più territori? Com'è cambiato un fenomeno nel tempo?
Visualizzare questi dati può aiutarci a comprendere in maniera più immediata un fenomeno e fare prendere al nostro lavoro giornalistico un'altra direzione: torniamo indietro, cerchiamo altri dati, li mettiamo a confronto.
Il Fact-checking: che cos'è?
Verificare le informazioni in maniera approfondita (comunicati stampa, dichiarazioni dei politici). Si sta diffondendo enormemente in relazione all'aumento della quantità di informazioni disponibili sul web.
Un esempio: pagellapolitica.it
Con i dati il Fact-checking è semplice!
Le best practices del Data Journalism prevedono che insieme alle inchieste vengano pubblicati i dati relativi, per permettere di verificare le visualizzazioni e i risultati. Noi abbiamo costruito dati.dataninja.it
Il futuro del giornalismo?
Ma anche no...
- La distinzione tra data journalism e giornalismo tradizionale non ha senso di esistere... ma è servita a delineare un metodo di lavoro e a definire una comunità di professionisti, ora riconosciuta.
-
Gli strumenti, le tecniche e le metodologie del giornalismo sono ormai indispensabili in ogni redazione che si ponga l'obiettivo di affrontare il racconto della nostra realtà usando tutti i dati e le informazioni oggi disponibili.
Sicuramente l'analisi dati e la scoperta di notizie richiedono un'approccio metodologico lontano dal giornalismo d'opinione (non a caso il data journalism è un termine anglosassone).
Detto anche giornalismo di precisione, quantitativo, esplicativo, ...
Buon lavoro!
Andrea Nelson Mauro / "nelsonmau"
nelsonmau@dataninja.it
Dataninja
Newsletter
Datamediahub