Crawlen/data scrapen

Vandaag:

Wat is "crawlen"?

De bekendste crawler van het web?

Google!

Waarom is crawlen nuttig voor journalisten?

Een web vol data!

Hoe werkt crawlen?

Algoritmes

Algoritme = een reeks opdrachten (aan een computer) met een bepaald doel

Programmeren?

Nee, liever met tools

Pas op: sommige websites zijn te groot, anderen blokkeren crawlers

Opdracht 1:

Wat: Crawl een website
 Hoe: import.io, in duo's

Eindresultaat: een prachtig ('groot') databestand

Tijd: 1 uur

Klaar: bedenk hoe je deze data zou visualiseren

Hoe kom je er snel achter of je "iets hebt"?

Heb je besloten welke data je gaat visualiseren? Aan de slag!

3 tools

Opdracht 2:

Wat: Maak een visualisatie
 Hoe: Datawrapper, LocalFocus of RAW

Eindresultaat: visualisatie van (een deel van) jouw data

Deadline: 12:30

Vragen?

slides.ingebeek

/diy-crawlen

DIY crawlen

By ingebeek

DIY crawlen

  • 812