Bevezetés az adattudományba

2024.10.24

1. alkalom
 

Adattudomány
Ősz 2024

1 ZB

ZETA-EXA-PETA

TERRA-GIGA-MEGA

Northeastern, 2016

figyelem

at tension

figyelemszegénység

"What information consumes is rather obvious: it consumes the attention of its recipients. Hence, a wealth of information creates a poverty of attention, and a need to allocate that attention efficiently among the overabundance of information sources that might consume it."

Herbert Simon (Hal Varian által idézve)
Scientific American, 1995

UW CSE442 kurzus és PARC UIR alapján
Portrait of Herbert Simon - Richard Rappaport CC BY 3.0


Udvarhelyen

hull a hó ❄

negyedmásodperc

Sabine Kastner et al., Princeton, 2018

250 millisec

digital garbage on my Facebook feed..
Mitchell Kapor-t szabadon idézve

információ-túlterheltség

vizualizáció =  megértés

"The ability to take data - to be able to understand it, to process it, to extract value from it, to visualize it, to communicate it - that's going to be a hugely important skill in the next decades, ...because now we really do have essentially free and ubiquitous data."

Hal Varian, Vezetõ Közgazdász, Google
The McKinsey Quarterly, 2009

UW CSE442 kurzus alapján
Hal Varian - Joi Ito CC BY 2.0

adat

információ

tudás

big data =

big responsibility

Datasaurus, Alberto Cairo, Autodesk, 2016

Péntek délután 3 óra tájban Józsi unokatestvére a szentkirályi piacra menet találkozott a kék szemú Ágotával, aki egy barna ruhát viselt.

kép-felsôbbrendûségi effektus

Allan Paivio, 1971
David McCandless, Information is Beautiful, 2012 alapján

látás

érintés

hallás szaglás

íz

David McCandless, Information is Beautiful, 2012 alapján

sight

touch

hearing smell

taste

kódolás

dekódolás

adatvizualizáció = jelrendszer

üzenet

Jacques Bertin, Sémiologie Graphique, 1967 alapján
Nathan Yau, Flowingdata, 2015 alapján
Csala Dénes, Romanian Economic Impact Monitor, 2021
Csala Dénes, székelydata, 2015

Erdély

Moldva

Havasalföld

Dobrudzsa

Altamirai barlangrajz, i.e. 36 000
Ted Chiang, Eric Heisserer, Martine Bertrand, Stephen & Christopher Wolfram "Louise" a Arrival filmhez tervezett földönkívüli nyelven, 2016 CC A-NC 4.0

Adatvizualizáció

2024.10.24

2. alkalom
 

BI
Ősz 2024

Adat- és képmodellek

       Nyers adat   -    Adattábla   -  Vizuális strukturák - Nézetek

Adatátalakítás - Vizuális kódolás - Nézetalakítás

Adatmodell

Elképzelésmodell

N: Névleges - Nominális

O: Rendezett - Ordered

Q: Mérhető - Quantitative

együtt a modellek:

adatok kontextusba helyezése

Adatreferencia

(pandas: index)

Képi jelrendszer: vizuális nyelv

Hasonlóság, sorrend és méretarány e vizuális nyelv szófajai!

Fókusz

Áttetszőség

(Animáció)

Vizuális jelzők - az információ egyértelmű vizuális kódolása

Bertin listája, elméleti, jel-értelmezési megközelítéssel

A vizuális nyelv jelzőinek hierarchiája az adatmodellek kontextusában

Vizualizációs design-kritériumok

Félreértelmezhetetlen kifejezőség

Funkcionális hatékonyság

Adatmodell-specifikus

vizualizációs jelzőhierarchia

Mackinlay listája, célzott pszihológiai kísérletezéssel
(egy-egy ábra értelmezése), képernyőkre optimizálva

Grafikus- és színmodellek

Melyik négyszög világosabb?

Melyik négyszög világosabb?

212, 212, 212

207, 207, 207

Melyik kör "nagyobb"?

Mennyivel / Hányszor?

7

Érzékelés

intenzitásgörbéje:

Hatványtörvény

 

Nem lineáris!

Stevens listája, pszhichológiai kísérletezéssel, érzékrangsorolás alapján

Színmodellek

Színtippek!

Vizualizáció típusok

Dr. Szász Levente

Az egyetem közösségi szerepvállalása válsághelyzetben: adatalapú járvány- és gazdasági  monitorizálás

2021.11.26

2. hét
3. lecke

Adattudomány
Ősz 2021

Sükösd Endre

Természetes nyelvfeldolgozás

2021.11.27

2. hét
4. lecke

Adattudomány
Ősz 2021

Adatworkshop 1

Adatvizualizáció

2021.11.27

2. hét
5. lecke

Adattudomány
Ősz 2021

Adatworkshop 2

Gépi tanulás

2021.11.27

2. hét
5. lecke

Adattudomány
Ősz 2021

Dr. Szilágyi Botond

Szuperszámítástechnika: útban az adatbányászat gyógytechnológiai alkalmazásai felé

2021.12.10

3. hét
6. lecke

Adattudomány
Ősz 2021

Összefoglaló

2021.12.11

3. hét
7. lecke

Adattudomány
Ősz 2021

Projektek

2021.12.11

3. hét
7. lecke

Adattudomány
Ősz 2021

Egyéni projekt

  • Releváns / érdekes probléma
  • Adatgyűjtésben/formázásban tud(t)ok segíteni
    • Készítünk egy adatbankot közösen
    • Határidő adatválasztásra Dec 10
    • Sor-alapú (standard/TIDY) formátumba kell transzformálni
    • Egye oszlop egy címke/attribútum
    • Meg kell határozni az oszlopok típusait
  • Exploratory viz / adatfelfedezés
  • Interaktív vizualizáció / Videóvizualizáció / Infografika
  • Hangsúly a tervezésen van, és miért az a legmegfelelőbb forma
  • Ezért fontos a probléma definiálása
  • Kb. 1000. adatpont / 4 dimenzió komplexitás
  • Kaggle Datasets for Visualization

Bemutatók

2022.01.08

4. hét
8. lecke

Adattudomány
Ősz 2021

Projektek bemutatása

3 perc / személy

peer-grading

Adattudomány kurzus 📊

By Dénes Csala

Adattudomány kurzus 📊

MCC, Adattudomány, Ősz 2021

  • 1,590