#migrantsfiles
Un'inchiesta europea sui migranti morti dal 2000 nel tentativo di raggiungere la Fortezza Europa
CC-BY 3.0 Italia
dataninja.it
dataninja.it / chi siamo
- Dataninja è un network di data journalism fondato nel 2012
-
Il nostro obiettivo è raccontare storie partendo dall’analisi dei dati, il data-driven story-telling
- Ci occupiamo di giornalismo e formazione con i principali gruppi editoriali italiani e con le pubbliche amministrazioni più avanzate in tema di Open Data.
Il contesto: le informazioni sul web
From the dawn of civilization until 2003, humankind generated five exabytes of data. Now we produce five exabytes every two days… and the pace is accelerating!
Eric Schmidt
,
Google’s executive chairman | Fonte: http://goo.gl/pgle3G
Perché visualizzare i dati?
Come non era mai successo nelle nostre vite, oggi abbiamo accesso a un’infinità di informazioni libere e gratuite. Con gli strumenti giusti possiamo cominciare a dare un senso a questi dati per vedere schemi e trend che altrimenti per noi sarebbero invisibili. Trasformando i numeri in forma grafica, permetteremo ai lettori di conoscere le storie che quei numeri nascondono.
Alberto Cairo, "The functional Art" | Fonte: http://goo.gl/KHm3hT
L'inchiesta su l'Espresso
Publication day: in contemporanea su 9 giornali
in sei Paesi europei il 31 marzo 2014
La notizia
Dal 2000 al 2013 più di 23 mila migranti morti
nel tentativo di raggiungere l'europa
le rotte
otto rotte di ingresso
la mortalità delle rotte
È stato possibile stimare un tasso di mortalità delle singole rotte, calcolo che evidenzia che la criticità maggiore si verifica nel transito di migranti tra il Magreb e la Sicilia
le basi dell'inchiesta
-
Non esistono monitoraggi ufficiali delle vittime (né dello Stato italiano, né dell'Unione Europea)
- Due agenzie UE monitorano le frontiere (Frontex, Eurosur)
-
Esistono raccolte dati basate su articoli e post pubblicati da mezzi di informaziond e blog di NGO (Fortress Europe, United for Intercultural Action, PULS dell'università di Helsinki)
-
Esistono studi su aree territoriali (Sicilia, Canarie) o su precise sezioni temporali (un singolo anno, una stagione)
fortress europe
Dataninja ha estratto i dati dal sito Fortress Europe.
united for intercultural action / puls
Journalism++ ha estratto i dati
di United for Intercultural Action e PULS
scraping / merging / deduplication
- È l'attività necessaria per estrarre i dati dai loro contenitori e strutturarli in tabella per renderli machine readable
- I dati sono stati estratti da: pagine html e pdf
- Sono stati riorganizzati replicando la struttura originale delle colonne (data / luogo / descrizione / fonte / ... )
- I dati sono stati aggregati in un'unica tabella e ripuliti attraverso un processo di deduplicazione per individuare ed eliminare i doppioni.
Il nuovo database
Contiene 2700+ eventi (nel corso dei quali sono
morti 23000+ migranti dal 2000 al 2013) ed è esplorabile
http://themigrantsfiles.com
entity extraction
I singoli eventi (es.: i naufragi) vengono messi in relazione
per l'estrazione di entità (es.: tipi di eventi, località, tipi di vittime) | Link: http://goo.gl/xy0h0Q
gioco di squadra
L'inchiesta è stata sviluppata da un team di oltre 10 giornalisti, analisti, sviluppatori sparsi per tutta Europa, tramite una piattaforma di lavoro condivisa.
ruoli e metodologia
- Un project manager si è occupato di coordinare il processo e garantire lo stato di avanzamento
- I giornalisti hanno cercato dati ed effettuato verifiche a campione sui singoli eventi (fact-checking)
-
Dataninja ha effettuato verifiche per stimare la possibilità di errore all'interno dei dati (stimato in massimo il 10%)
Metodologia su l'espresso
Nell'inchiesta pubblicata su L'Espresso è stato pubblicata anche la metodologia di lavoro | Link: http://goo.gl/9gpvlA
fact-checking all'università
Gli studenti di data journalism dell'Università di Bologna hanno contribuito a verificare i singoli eventi (grazie a Carlo Gubitosa)
31 marzo 2014: il publication day
L'inchiesta è stata pubblicata in contemporanea
su 9 giornali di 6 diversi paesi europei il 31 marzo 2014, generando uno diffusione capillare in ogni Paese
L'impatto
In 24 ore sono stati prodotti 2000+ tweet in 11 lingue diverse
Prevalentemente: inglese, francese, italiano, tedesco, spagnolo e greco | http://goo.gl/cTZyqq
I premi: Brussels e Barcelona
L'inchiesta è stata presentata durante la DataHarvest+ Conference a Brussels e ha vinto i Data Journalism Awards, assegnati a Barcelona (giugno 2014)