Tra dati e notizie

Raccontare storie guidati da numeri, tabelle e infografiche


Andrea Nelson Mauro




Corso di Data Driven Journalism
Istituto Superiore Giornalismo
Palermo, 15 maggio 2014

Dataninja.it

Data journalism & data visualization made in Italy

Il data journalism

Una storia che viene da lontano

There was 5 exabytes of information created between the dawn of civilization through 2003, but that much information is now created every 2 days, and the pace is increasing (Eric Schmidt)

Il primo uso del computer a fini giornalistici risale al 1952 negli USA: nasce il C.A.R. (Computer Assisted Reporting).

Nel 1967 Philip Meyer consacra questa pratica con un’inchiesta di successo (1968: A Newspaper's Role Between the Riots).

Nel 1973 Meyer stesso fonda il giornalismo di precisione, coniugando tecnologia e metodo scientifico (Giornalismo e metodo scientifico).

Con l'accento sulla j

Il vecchio e caro giornalismo, ma con numeri e tabelle



Quest'anno hanno partecipato 520 progetti, ridotti a 75 dopo la prima selezione (tre italiani): i vincitori finali saranno solo 8.

Peculiarità del data journalism


Ingredienti:
  • disponibilità di dati quantitativi (numeri o roba misurabile)
  • possibilità di processarli e analizzarli (viva i calcolatori)
  • metodo scientifico (mica per altro, è che funziona)
  • onestà intellettuale (anche nota come deontologia professionale)
  • fiuto per la notizia
  • competenze narrative (non solo l'italiano, ma anche forme e colori)

Da giornalisti, dobbiamo sempre raccontare storie...

... ormai sempre più basate su dati digitali!

Peculiarità del data journalism


Richiede competenze multi-disciplinari e quindi team di professionisti:
  • giornalista
  • data scientist / statistico
  • sviluppatore
  • designer / grafico

Porta facilmente a prodotti giornalistici di lunga vita o a temi su cui tornare a più riprese.

Ci sono ampie libertà di riutilizzo e riciclo.

Il rilascio dei dati permette di costruire comunità attorno ad essi: non solo giornalismo informativo, quindi, ma anche di servizio.

Limiti del data journalism


Richiede molta accortezza nell'uso degli strumenti statistici.

Si rischiano prodotti giornalistici “belli”, ma fini a se stessi.

Spesso è necessario imparare a usare software con curve di apprendimento abbastanza ripide.

Gli strumenti e le piattaforme cambiano molto velocemente e bisogna rimanere aggiornati.

Spesso si usano servizi di terze parti di cui non si ha il controllo.

Tutti quelli del giornalismo...

Temi, tipologie e mezzi


Non c'è limite ai temi che si possono affrontare: sociale, politico, scientifico, economico, sportivo, persino gossip...

La ricerca con metodo è un approccio tipico del giornalismo d'inchiesta, ma si sposa bene anche con quello di cronaca, il reportage, persino l'intervista...

Il racconto e la visualizzazione dei dati si esprimono al meglio su web, ma possono essere molto efficaci anche sulla carta, nel foto e video giornalismo, in tv e alla radio...

È più una questione di metodo e materie prime che di temi, specializzazioni, ambienti, media...

Il processo di produzione

La teoria delle quattro fasi

Mi imbatto in un insieme di dati e sento il profumo di una possibile notizia: li raccolgo, li analizzo, faccio delle ipotesi, le verifico...
scopro la notizia.

Ma posso anche avere un interesse, un’idea, una tesi, cerco i dati che la riguardano, li analizzo, rivedo l’idea iniziale, torno ai dati...
scopro la notizia.

Trovare
Pulire
Analizzare
Raccontare

Minatori, o le fonti di dati

Dove cercare e come capire di aver trovato

Tipo di dati:
  • non strutturati;
  • strutturati (con metadati).


Titolarità e diritti di riutilizzo:
  • open data (opendefinition.org);
  • copyright;
  • privacy, diritto all'oblio, segreto statistico, ...

Accesso ai dati:

Minatori, o le fonti di dati

Dove cercare e come capire di aver trovato

L'affidabilità dei dati coincide con quella della fonte.

Pubblica Amministrazione:

La PA è un'enorme fonte di dati, spesso open, ma non è l'unica:
  • grandi aziende private o miste
  • associazioni, ong
  • social network
  • amatori
  • colleghi o noi stessi



Minatori, o le fonti di dati

Dove cercare e come capire di aver trovato

Formato dei dati digitali:
  • pdf,
  • pagine web in html,
  • csv,
  • fogli di calcolo (xls, xlsx, ods),
  • database,
  • end-point interrogabili.

Per essere utili devono essere machine readable: non dobbiamo leggerli noi, ma farli leggere alle macchine!

L'arte dello scraping: DataMiner & Co.


Spazzini, o la pulizia dei dati

Verificare, individuare errori, correggere

Premesse sbagliate portano (quasi) sempre a conclusioni sbagliate, anche se il ragionamento è corretto.

Pure se affidabile, anche la fonte può sbagliare. Così come può barare, truccare, mentire, nascondere, omettere, ecc.

Da controllare sempre prima di tutto:
  • coerenza interna,
  • completezza,
  • verosimiglianza.

Non buttar via mai niente e tenere traccia di quello che si fa...

Spazzini, o la pulizia dei dati

Verificare, individuare errori, correggere

Strumenti dei fogli di calcolo:
  • filtri e funzioni di ordinamento;
  • formattazione condizionale;
  • definizione esplicita dei tipi (stringa, numero, data, ...);
  • semplici grafici.

Uno strumento ad hoc: Open Refine (openrefine.org).


Esploratori, o la ricerca  della notizia

Interrogare i dati e andare oltre i numeri

Ingredienti:
  • fiuto (e occhio);
  • esperienza;
  • propensione al dubbio q.b.;
  • un pizzico di statistica e matematica.

Preparazioni di base:
  • normalizzazione;
  • variazione;
  • distribuzione;
  • correlazione;
  • filtro, ordinamento, aggregazione.

Cantastorie, o la scrittura del pezzo

Raccontare i dati con grafici e parole

Occhiello
Titolo
Sommario
Attacco
Notizia
Corpo
Chiusa

Tutto come al solito, però questa volta abbiamo dati e numeri.

Li possiamo raccontare a parole oppure visualizzarli...

Cantastorie, o la scrittura del pezzo

Raccontare i dati con grafici e parole

Visualizzare i dati significa decidere come connetterli alle proprietà che definiscono forme geometriche ed elementi grafici

Principali modalità di visualizzazione:
  • grafici base (dispersione, linee, barre, bolle, torte);
  • mappe geografiche;
  • grafi (detti anche reti);
  • timeline.

Alcuni strumenti alla rinfusa: datawrapper, infogr.am, raw, cartodb, google fusion tables, timelinejs, qgis, gephi, d3js, ...

Il futuro del giornalismo?

Ma anche no...

La distinzione tra data journalism e giornalismo tradizionale non ha senso di esistere... ma è servita a delineare un metodo di lavoro e a definire una comunità di professionisti, ora riconosciuta.

In un mondo sempre più permeato di dati digitali, in cui informazione e notizie esistono sotto forma di dati digitali, un giornalista che non sa trattarli... perde un'occasione ogni volta che li incontra!

Sicuramente l'analisi dati e la scoperta di notizie richiedono un'approccio metodologico lontano dal giornalismo d'opinione (non a caso il data journalism è un termine anglosassone).

Detto anche giornalismo di precisione, quantitativo, esplicativo, ...

Buon lavoro!


Andrea Nelson Mauro / "nelsonmau"
nelsonmau@dataninja.it

Dataninja

Newsletter

Q&A


Tra dati e notizie - Istituto Superiore Giornalismo - Palermo

By Dataninja srls

Tra dati e notizie - Istituto Superiore Giornalismo - Palermo

Lezione per giornalisti nell'ambito della formazione professionale continua presso l'Istituto Superiore di Giornalismo di Palermo (15 maggio 2014).

  • 2,467
Loading comments...

More from Dataninja srls