Tool per raccogliere, pulire e analizzare

i dati

Gianluca De Martino | @glucademartino

Andrea Nelson Mauro | @nelsonmau

Network europeo di data giornalisti

  • Inchieste
  • Altri progetti
    • Sport data journalism (blogf1)
    • Associazione onData (sito)
    • Datamediahub (blog)

Alessio, Andrea, Andrea, Carlo, Donata, Elena, Gianluca, Mara, Nicola, ...

Scraping

Tecnica informatica che consiste nel "grattare" ed estrarre dati da un sito web mediante programmi software

Procedura necessaria quando manca un dataset già costruito in formato "machine readable", ossia processabile da un computer

Pagine html

Immagini

File Pdf

Kawabonga!

Gianluca De Martino

gdemartino@dataninja.it

@glucademartino

onData

www.ondata.it

Andrea Nelson Mauro

nelsonmau@dataninja.it

@nelsonmau

Icon made by Freepik from www.flaticon.com

Scraping da pdf

Tabula

ScraperWiki

Tools

per lo scraping da html

Data Scraper: estensione di Chrome

Table Capture: estensione di Chrome

Credits: Flickr/the-magic-tuba-pixie

Made with Slides.com