Bevezetés az adattudományba

2022.10.07

1. hét
1. lecke

Adattudom√°ny
Ňźsz 2022

1 ZB

ZETA-EXA-PETA

TERRA-GIGA-MEGA

Northeastern, 2016

figyelem

at tension

figyelemszegénység

"What information consumes is rather obvious: it consumes the attention of its recipients. Hence, a wealth of information creates a poverty of attention, and a need to allocate that attention efficiently among the overabundance of information sources that might consume it."

Herbert Simon (Hal Varian által idézve)
Scientific American, 1995

UW CSE442 kurzus és PARC UIR alapján
Portrait of Herbert Simon - Richard Rappaport CC BY 3.0


Udvarhelyen

hull a h√≥ ‚ĚĄ

negyedm√°sodperc

Sabine Kastner et al., Princeton, 2018

250 millisec

digital garbage on my Facebook feed..
Mitchell Kapor-t szabadon idézve

inform√°ci√≥-t√ļlterhelts√©g

vizualizáció =  megértés

"The ability to take data - to be able to understand it, to process it, to extract value from it, to visualize it, to communicate it - that's going to be a hugely important skill in the next decades, ...because now we really do have essentially free and ubiquitous data."

Hal Varian, Vezet√Ķ K√∂zgazd√°sz, Google
The McKinsey Quarterly, 2009

UW CSE442 kurzus alapj√°n
Hal Varian - Joi Ito CC BY 2.0

adat

információ

tud√°s

big data =

big responsibility

Datasaurus, Alberto Cairo, Autodesk, 2016

P√©ntek d√©lut√°n 3 √≥ra t√°jban J√≥zsi unokatestv√©re a szentkir√°lyi piacra menet tal√°lkozott a k√©k szem√ļ¬†√Āgot√°val, aki egy barna ruh√°t viselt.

k√©p-fels√ībbrend√Ľs√©gi effektus

Allan Paivio, 1971
David McCandless, Information is Beautiful, 2012 alapj√°n

l√°t√°s

érintés

hall√°s szagl√°s

íz

David McCandless, Information is Beautiful, 2012 alapj√°n

sight

touch

hearing smell

taste

kódolás

dekódolás

adatvizualizáció = jelrendszer

√ľzenet

Jacques Bertin, Sémiologie Graphique, 1967 alapján
Nathan Yau, Flowingdata, 2015 alapj√°n
Csala Dénes, Romanian Economic Impact Monitor, 2021
Csala Dénes, székelydata, 2015

Erdély

Moldva

Havasalföld

Dobrudzsa

Altamirai barlangrajz, i.e. 36 000
Ted Chiang, Eric Heisserer, Martine Bertrand, Stephen & Christopher Wolfram "Louise" a Arrival filmhez tervezett f√∂ld√∂nk√≠v√ľli nyelven, 2016 CC A-NC 4.0

Adatvizualizáció

2023.10.24

1. hét
1. lecke

Adattudom√°ny
Ňźsz 2023

Adat- és képmodellek

       Nyers adat   -    Adattábla   -  Vizuális strukturák - Nézetek

Adatátalakítás - Vizuális kódolás - Nézetalakítás

Adatmodell

Elképzelésmodell

N: Névleges - Nominális

O: Rendezett - Ordered

Q: M√©rhetŇĎ - Quantitative

egy√ľtt a modellek:

adatok kontextusba helyezése

Adatreferencia

(pandas: index)

Képi jelrendszer: vizuális nyelv

Hasonlóság, sorrend és méretarány e vizuális nyelv szófajai!

Fókusz

√ĀttetszŇĎs√©g

(Animáció)

Vizu√°lis jelzŇĎk - az inform√°ci√≥ egy√©rtelmŇĪ vizu√°lis k√≥dol√°sa

Bertin listája, elméleti, jel-értelmezési megközelítéssel

A vizu√°lis nyelv jelzŇĎinek hierarchi√°ja az adatmodellek kontextus√°ban

Vizualizációs design-kritériumok

F√©lre√©rtelmezhetetlen kifejezŇĎs√©g

Funkcionális hatékonyság

Adatmodell-specifikus

vizualiz√°ci√≥s jelzŇĎhierarchia

Mackinlay listája, célzott pszihológiai kísérletezéssel
(egy-egy √°bra √©rtelmez√©se), k√©pernyŇĎkre optimiz√°lva

Grafikus- és színmodellek

Melyik négyszög világosabb?

Melyik négyszög világosabb?

212, 212, 212

207, 207, 207

Melyik kör "nagyobb"?

Mennyivel / H√°nyszor?

7

√Črz√©kel√©s

intenzitásgörbéje:

Hatványtörvény

 

Nem line√°ris!

Stevens listája, pszhichológiai kísérletezéssel, érzékrangsorolás alapján

Színmodellek

Színtippek!

Vizualizáció típusok

Dr. Sz√°sz Levente

Az egyetem k√∂z√∂ss√©gi szerepv√°llal√°sa v√°ls√°ghelyzetben: adatalap√ļ j√°rv√°ny- √©s gazdas√°gi¬† monitoriz√°l√°s

2021.11.26

2. hét
3. lecke

Adattudom√°ny
Ňźsz 2021

S√ľk√∂sd Endre

Természetes nyelvfeldolgozás

2021.11.27

2. hét
4. lecke

Adattudom√°ny
Ňźsz 2021

Adatworkshop 1

Adatvizualizáció

2021.11.27

2. hét
5. lecke

Adattudom√°ny
Ňźsz 2021

Adatworkshop 2

Gépi tanulás

2021.11.27

2. hét
5. lecke

Adattudom√°ny
Ňźsz 2021

Dr. Szil√°gyi Botond

Szupersz√°m√≠t√°stechnika: √ļtban az adatb√°ny√°szat gy√≥gytechnol√≥giai alkalmaz√°sai fel√©

2021.12.10

3. hét
6. lecke

Adattudom√°ny
Ňźsz 2021

√Ėsszefoglal√≥

2021.12.11

3. hét
7. lecke

Adattudom√°ny
Ňźsz 2021

Projektek

2021.12.11

3. hét
7. lecke

Adattudom√°ny
Ňźsz 2021

Egyéni projekt

  • Relev√°ns / √©rdekes probl√©ma
  • AdatgyŇĪjt√©sben/form√°z√°sban tud(t)ok seg√≠teni
    • K√©sz√≠t√ľnk egy adatbankot k√∂z√∂sen
    • Hat√°ridŇĎ adatv√°laszt√°sra Dec 10
    • Sor-alap√ļ (standard/TIDY) form√°tumba kell transzform√°lni
    • Egye oszlop egy c√≠mke/attrib√ļtum
    • Meg kell hat√°rozni az oszlopok t√≠pusait
  • Exploratory viz / adatfelfedez√©s
  • Interakt√≠v vizualiz√°ci√≥ / Vide√≥vizualiz√°ci√≥ / Infografika
  • Hangs√ļly a tervez√©sen van, √©s mi√©rt az a legmegfelelŇĎbb forma
  • Ez√©rt fontos a probl√©ma defini√°l√°sa
  • Kb. 1000. adatpont / 4 dimenzi√≥ komplexit√°s
  • Kaggle Datasets for Visualization

Bemutatók

2022.01.08

4. hét
8. lecke

Adattudom√°ny
Ňźsz 2021

Projektek bemutat√°sa

3 perc / személy

peer-grading

Adattudom√°ny kurzus ūüďä

By Dénes Csala

Adattudom√°ny kurzus ūüďä

MCC, Adattudom√°ny, Ňźsz 2021

  • 1,322