Datascraping

Persacademie, 25 oktober 2016

101

Vandaag

Scraping

PDF's

HTML

Mijn eerste scraper

Tools

 

Maar...

"The best advice for anyone seeking to learn scraping or data journalism, then, is this: find a problem to solve first."

Scraping for journalists, Paul Bradshaw

slides.com/maartenzam/datascraping

Maarten Lambrechts?

Jullie?

PDFs

Hoe een webpagina werkt

In een notendop

URL

Tags

<p>Blablabla</p>

<div>Vanalles</div>

<table>
    <tr>
        <td>kolom1</td><td>kolom2</td>
    </tr>
    <tr>
        <td>waarde1</td><td>waarde2</td>
    </tr>
</table>

<ul>
    <li>eerste item</li>
    <li>tweede item</li>
</ul>

<a>www.maartenlambrechts.be</a>

Attributen

<p class="center">Blablabla</p>

<div id="first">Vanalles</div>

<table id="datatable">
    <tr class="first-row">
        <td>kolom1</td><td>kolom2</td>
    </tr>
    <tr>
        <td>waarde1</td><td>waarde2</td>
    </tr>
</table>

<ul>
    <li id="first-item">eerste item</li>
    <li id="second-item">tweede item</li>
</ul>

<a href="http://www.maartenlambrechts.be">www.maartenlambrechts.be</a>

Broncode: klik rechts => 'View Page Source'

Inspecteer: klik rechts => 'Inspect Element'

Avancer pour mieux sauter

Een scraper aan het werk

Reculer pour mieux sauter

Google Drive

Meest gelezen in Vlaanderen

Voorbeelden

Tools

Chrome plugins

Online tools

Apps

Let's scrape!

Data

www.lokalestatistieken.be

 

Dank

Datascraping

By maartenzam