Dai dati al giornalismo

Alessio Cimarelli (@jenkin27)
www.dataninja.it

Bologna, 27 novembre 2013

Dati

Un dato (dal latino datum che significa letteralmente fatto) è una descrizione elementare, spesso codificata, di una cosa, di una transazione, di un avvenimento.
L'elaborazione dei dati può portare alla conoscenza di un'informazione.
Ogni tipo di dato dipende dal codice e dal formato impiegati.
I dati possono presentarsi sotto diverse forme (Wikipedia dixit)

Sono entità misurabili con un significato relativo al contesto in cui si presentano o vengono raccontate.

Per comprenderli e manipolarli è necessario rappresentarli!

Oggetti e proprietà


Quando descriviamo, analizziamo e raccontiamo un fenomeno abbiamo a che fare con tanti oggetti: luoghi, flussi di denaro, documenti, atti, ma anche persone.

Questi oggetti sono definiti da un insieme (finito) di proprietà che li caratterizzano: posizione, dimensioni, durata, ...

Le proprietà di un oggetto possono essere di tipo quantitativo (numeri, misure), qualitativo (categorie) o meramente descrittivo (testi liberi).

Dataset


Una collezione omogenea di oggetti con le relative proprietà costituisce un dataset.

La forma più usata per rappresentare un dataset?


La tabella

Rappresentazioni

Biblioteca n. 1
  • Nome
  • Responsabile
  • Latitudine
  • Longitudine
  • Numero addetti
  • Numero libri
  • Orario
  • ...
Biblioteca n. 2
  • Nome
  • Responsabile
  • Latitudine
  • Longitudine
  • Numero addetti
  • Numero libri
  • Orario
  • ...
Biblioteca n. 3
  • Nome
  • Responsabile
  • Latitudine
  • Longitudine
  • Numero addetti
  • Numero libri
  • Orario
  • ...

Rappresentazioni (2)


N. Nome Responsabile Latitudine Longitudine ...
1 ... ... ... ... ...
2 ... ... ... ... ...
3 ... ... ... ... ...

Ogni tabella rappresenta un insieme omogeneo di oggetti.
In una tabella ogni riga rappresenta un oggetto unico.
Le colonne rappresentano le proprietà.

Meglio avere un nome univoco per chiamare ogni oggetto (colonna N.), senza che si "girino tutti".

Ordinare, filtrare e aggregare


Data una proprietà (colonna), si possono ordinare gli oggetti (righe) in base ad essa.

Data una proprietà, si possono filtrare gli oggetti in base ai valori che assume.

Date due proprietà, si possono aggregare (conteggio, somma, media, ...) i dati della seconda in base ai valori della prima.

Tabelle pivot

Chiamale se vuoi... relazioni


Ridurre una molteplicità di oggetti a una descrizione con poche variabili globali (medie, varianze, tassi, incidenze, ...) permette di sintetizzare un fenomeno.

Non basta però per cogliere le (cor)relazioni tra fenomeni.

Una percentuale non è analisi statistica.
Anonimo

Un mondo vario


Oggetti eterogenei (definiti da insiemi diversi di proprietà) sono rappresentati da diverse tabelle.

Una proprietà può avere come valore un riferimento a un oggetto (es. responsabile di biblioteca).

Una proprietà che si riferisce a un altro oggetto costituisce una relazione tra oggetti.

Reti

Visualizzare i dati



Dati in una mano, immagini nell'altra

Dati rappresentati da numeri,
parametri grafici misurati con numeri


La chiave sta nel connettere opportunamente i dati ai parametri degli elementi da visualizzare

Strumenti


Non importa!

Qualunque strumento usiate per i fogli di calcolo, avrete a che fare sempre con tabelle.

Quindi con oggetti, proprietà, ordinamenti, filtri, tabelle pivot, analisi statistica, relazioni, ...

Non fatevi fregare da un pulsante che cambia nome e si sposta di una manciata di pixel!

E ora a voi!




http://goo.gl/Wf3cLB

Made with Slides.com