Bevezetés az informatikába (BMEGT43A020)

6. adatbeszerzés, tisztítás, rendszerezés

Formátumok

 

Tabuláris:

xls
xlsx
csv
json
xml

 

Térinformatikai:
kml
geojson
shp
geotiff

 

Képalapú:
pdf

jpeg

keresés

letöltés

konvertálás

tárolás, előkészítés

elemzés

ábrázolás

keresés

 

Helyi, lokális adatbázisok (céginformációs adatbázisok, opten)

Országos adatbázisok (KSH)

Többországos adatbázisok (Eurostat, OECD)

Globális adatbázisok (Ourworldindata)

Speciális adatbázisok (Freedom House, Transparency, RSF, indexek, Átlátszó)

 

 

letöltés

 

ctrl+C ctrl+V:

http://www.johnstonsarchive.net/nuclear/tests/index.html

https://vtr.valasztas.hu/ogy2022/egyeni-valasztokeruletek?tab=county

 

Google Sheets képletek (importHTML, importXML)

https://devhints.io/xpath

 

Google Chrome plugin “Scraper”:

https://chrome.google.com/.../mbigbapnjcgaffohmbkdlecacce...

https://www.imdb.com/chart/top/

 

python scraper imdb

konvertálás

 

Tabula: https://tabula.technology (PDF-ből CSV)

https://www.onlineocr.net/pdftoexcel (Képalapú PDF táblázattá, OCR (Optical Character Recognition))

Köszönöm a figyelmet!

szabo.krisztian96@gmail.com