6. adatbeszerzés, tisztítás, rendszerezés
Formátumok
Tabuláris:
xls
xlsx
csv
json
xml
Térinformatikai:
kml
geojson
shp
geotiff
Képalapú:
pdf
jpeg
keresés
letöltés
konvertálás
tárolás, előkészítés
elemzés
ábrázolás
keresés
Helyi, lokális adatbázisok (céginformációs adatbázisok, opten)
Országos adatbázisok (KSH)
Többországos adatbázisok (Eurostat, OECD)
Globális adatbázisok (Ourworldindata)
Speciális adatbázisok (Freedom House, Transparency, RSF, indexek, Átlátszó)
letöltés
ctrl+C ctrl+V:
http://www.johnstonsarchive.net/nuclear/tests/index.html
https://vtr.valasztas.hu/ogy2022/egyeni-valasztokeruletek?tab=county
Google Sheets képletek (importHTML, importXML)
https://devhints.io/xpath
Google Chrome plugin “Scraper”:
https://chrome.google.com/.../mbigbapnjcgaffohmbkdlecacce...
https://www.imdb.com/chart/top/
python scraper imdb
konvertálás
Tabula: https://tabula.technology (PDF-ből CSV)
https://www.onlineocr.net/pdftoexcel (Képalapú PDF táblázattá, OCR (Optical Character Recognition))
Köszönöm a figyelmet!
szabo.krisztian96@gmail.com