Dai dati al giornalismo
Bologna, 27 novembre 2013
Dati
Un dato (dal latino datum che significa letteralmente fatto) è una descrizione elementare, spesso codificata, di una cosa, di una transazione, di un avvenimento.
L'elaborazione dei dati può portare alla conoscenza di un'informazione.
Ogni tipo di dato dipende dal codice e dal formato impiegati.
I dati possono presentarsi sotto diverse forme (Wikipedia dixit)
Sono entità misurabili con un significato relativo al contesto in cui si presentano o vengono raccontate.
Per comprenderli e manipolarli è necessario rappresentarli!
Oggetti e proprietà
Quando descriviamo, analizziamo e raccontiamo un fenomeno abbiamo a che fare con tanti oggetti: luoghi, flussi di denaro, documenti, atti, ma anche persone.
Questi oggetti sono definiti da un insieme (finito) di proprietà che li caratterizzano: posizione, dimensioni, durata, ...
Le proprietà di un oggetto possono essere di tipo quantitativo (numeri, misure), qualitativo (categorie) o meramente descrittivo (testi liberi).
Dataset
Una collezione omogenea di oggetti con le relative proprietà costituisce un dataset.
La forma più usata per rappresentare un dataset?
La tabella
Rappresentazioni
Biblioteca n. 1
- Nome
- Responsabile
- Latitudine
- Longitudine
- Numero addetti
- Numero libri
- Orario
- ...
Biblioteca n. 2
- Nome
- Responsabile
- Latitudine
- Longitudine
- Numero addetti
- Numero libri
- Orario
- ...
Biblioteca n. 3
- Nome
- Responsabile
- Latitudine
- Longitudine
- Numero addetti
- Numero libri
- Orario
- ...
Rappresentazioni (2)
N.
|
Nome
|
Responsabile
|
Latitudine
|
Longitudine
|
...
|
1
|
...
|
...
|
...
|
...
|
...
|
2
|
...
|
...
|
...
|
...
|
...
|
3
|
...
|
...
|
...
|
...
|
...
|
Ogni tabella rappresenta un insieme omogeneo di oggetti.
In una tabella ogni riga rappresenta un oggetto unico.
Le colonne rappresentano le proprietà.
Meglio avere un nome univoco per chiamare ogni oggetto (colonna N.), senza che si "girino tutti".
Ordinare, filtrare e aggregare
Data una proprietà (colonna), si possono ordinare gli oggetti (righe) in base ad essa.
Data una proprietà, si possono filtrare gli oggetti in base ai valori che assume.
Date due proprietà, si possono aggregare (conteggio, somma, media, ...) i dati della seconda in base ai valori della prima.
Tabelle pivot
Chiamale se vuoi... relazioni
Ridurre una molteplicità di oggetti a una descrizione con poche variabili globali (medie, varianze, tassi, incidenze, ...) permette di sintetizzare un fenomeno.
Non basta però per cogliere le (cor)relazioni tra fenomeni.
Una percentuale non è analisi statistica.
Anonimo
Un mondo vario
Oggetti eterogenei (definiti da insiemi diversi di proprietà) sono rappresentati da diverse tabelle.
Una proprietà può avere come valore un riferimento a un oggetto (es. responsabile di biblioteca).
Una proprietà che si riferisce a un altro oggetto costituisce una relazione tra oggetti.
Reti
Visualizzare i dati
Dati in una mano, immagini nell'altra
Dati rappresentati da numeri,
parametri grafici misurati con numeri
La chiave sta nel connettere opportunamente i dati ai parametri degli elementi da visualizzare
Strumenti
Non importa!
Qualunque strumento usiate per i fogli di calcolo, avrete a che fare sempre con tabelle.
Quindi con oggetti, proprietà, ordinamenti, filtri, tabelle pivot, analisi statistica, relazioni, ...
Non fatevi fregare da un pulsante che cambia nome e si sposta di una manciata di pixel!