Datascraping
Persacademie, 25 oktober 2016
101
Vandaag
Scraping
PDF's
HTML
Mijn eerste scraper
Tools
Maar...
"The best advice for anyone seeking to learn scraping or data journalism, then, is this: find a problem to solve first."
Scraping for journalists, Paul Bradshaw
slides.com/maartenzam/datascraping
Maarten Lambrechts?
Jullie?
PDFs
Hoe een webpagina werkt
In een notendop
Tags
<p>Blablabla</p>
<div>Vanalles</div>
<table>
<tr>
<td>kolom1</td><td>kolom2</td>
</tr>
<tr>
<td>waarde1</td><td>waarde2</td>
</tr>
</table>
<ul>
<li>eerste item</li>
<li>tweede item</li>
</ul>
<a>www.maartenlambrechts.be</a>
Attributen
<p class="center">Blablabla</p>
<div id="first">Vanalles</div>
<table id="datatable">
<tr class="first-row">
<td>kolom1</td><td>kolom2</td>
</tr>
<tr>
<td>waarde1</td><td>waarde2</td>
</tr>
</table>
<ul>
<li id="first-item">eerste item</li>
<li id="second-item">tweede item</li>
</ul>
<a href="http://www.maartenlambrechts.be">www.maartenlambrechts.be</a>
Broncode: klik rechts => 'View Page Source'
Inspecteer: klik rechts => 'Inspect Element'
Avancer pour mieux sauter
Een scraper aan het werk
Reculer pour mieux sauter
Google Drive
Meest gelezen in Vlaanderen
Voorbeelden
Tools
Chrome plugins
Online tools
Apps
Let's scrape!
Data
www.lokalestatistieken.be
Dank
Datascraping
By maartenzam
Datascraping
- 3,612