Business Intelligence

Dr Csala Dénes

Kolozsvár

2018 november 21-22

Microsoft

olvasd el ezt most

https://tinyurl.com/fsega-bi

databanya

szekelydata

elméletileg 3 rész

  • Adattípusok és adatvizualizáció alapok
  • Alapvető statisztikai eljárások és adatelemzés
  • Adavizualizáció fejlesztés és történetmesélés


  • Nov 21-22: Elmélet
  • Dec 20-21: Gyakorlat
  • Jan: Bemutatók

moodle

  • link
  • ez jó dolog, használjuk
  • jegyzetek, blabla, de ami legfontosabb:
    • FÓRUM, éspedig 2:
      • Hirdetések fórum
      • Q&A fórum
  • jegyek is itt lesznek

elméletileg 3 rész

  • Adattípusok és adatvizualizáció alapok
  • Alapvető statisztikai eljárások és adatelemzés
  • Adavizualizáció fejlesztés és történetmesélés

elbírálás

  • Egyéni projekt: 40%
  • Csoportos projekt: 40%
  • Jegyeket a társaitoktól is kaptok: 10-10%
  • Januárban mindenki bemutatja a projektjét

Bevezetés az
adatok világába

adatvizualizáció

http://csaladen.es/present

http://csaladen.es/live

Disclaimer

  • Englisch speakings good, ja!
  • Y U NO speak magyar?
  • Hibázni jó!
  • Szeddalábad

Credit

Jeffrey Heer - University of Washington Interactive Data Lab

http://courses.cs.washington.edu/courses/cse512/16sp/

 

Alexander Simoes, Dave Landry - MIT Media Lab, Datawheel, D3plus

 

Mike Bostock - countless D3 examples

 

David McCandless - Knowledge is Beautiful

Órarend

  • 08:00-09:30 Bevezetés az adatok világába: sneak-peak
  • 09:40-10:30 A vizualizáció értéke
  • 10:40-11:10 Adat- és képmodellek
  • 11:20-12:50 Grafikus és színmodellek
  • 11:20-12:50 Vizualizáció típusok
  • 15:40-17:10 Projektötlet, csoportok, adatkeresés
  • 17:20-18:50 Projekt adatszerzés, formálás

 

  • 08:00-09:30 Webfelület alapok (HTML, CSS, JavaScript)
  • 09:40-11:10 D3.js | D3plus
  • 11:20-12:50 Python | pandas | JSON
  • 13:00-14:00 Az adatvizualizáció véleményformáló ereje

Sneak-peak

Adat
Információ
Tudás

Mi az adat?

456?
456?456?

Tüzesen süt le a nyári nap sugára

Az ég tetejéről a juhászbojtárra.

adat = az információ elemi egysége

minőségi

A labda piros.

A versenypálya kör alakú.

Árpád jómunkásember.

Csíkban hideg van.

mennyiségi

diszkrét

- Ma 12 paradicsomot ettem.

- Ma 2 pohár vizet ittam.

 

folytonos

- Ma 2 és fél liter vizet ittam.

- Kint mínusz 12.4 fok van.

az adatokat

  • mérjük
  • gyűjtjük
  • feljegyezzük
  • elemezzük
  • megjelenítjük

adatok megjelenítése

minőségi (kvalitatív) táblázat

Hónap Évszak Fun
Január Tél - 25 not fun : (
Február Tél sízés rulzz
Július Nyár természet yay! : )
Augusztus Nyár sunshine | beach

adatok megjelenítése

mennyiségi (kvantitatív) táblázat

Teknőc Penge Bot
Leonardo 2 0
Donatello 0 1
Rafaello 6 0
Michelangelo 0 4

adatok megjelenítése

összetett táblázat

Teknőc Penge Bot Cool Szín
Leonardo 2 0 5 kék
Donatello 0 1 2 lila
Rafaello 6 0 7 piros
Michelangelo 0 4 10 narancs

adatok megjelenítése

oszlopdiagram

adatok megjelenítése

oszlopdiagram + kvalitatív információ

adatok megjelenítése

oszlopdiagram+

adatok megjelenítése

oszlopdiagram++

adatok megjelenítése

tortadiagram

adatok megjelenítése

hierarchia/fa-térkép

adatok megjelenítése

oszlop

diagram

adatok megjelenítése

vonaldiagram

adatok megjelenítése

pontdiagram

adatok megjelenítése

hálózat

adatok megjelenítése

Sankey-diagram

adatok megértése

grafikon infografika

adatok megértése

infografi...whaaat?

adatok megértése

grafikon infografika

 

letisztítás

kihámozás

Fél(re)információ 101

Fél(re)információ 101

Fél(re)információ 101

Fél(re)információ 101

Fél(re)információ 101

Fél(re)információ 101

Fél(re)információ 101

Fél(re)információ 101

Fél(re)információ 101

Fél(re)információ élőben

Fél(re)információ élőben

Fél(re)információ élőben

Fél(re)információ élőben

Fél(re)információ élőben

Fél(re)információ élőben

Fél(re)információ élőben

Fél(re)információ élőben

Fél(re)információ élőben

Fél(re)információ élőben

Fél(re)információ élőben

Fél(re)információ élőben

Fél(re)információ élőben

Fél(re)információ élőben

Fél(re)információ élőben

Fél(re)információ élőben

információ összekapcsolása

infografika adatvizualizáció

0. infografika

1. interaktív infografika

2. (egyszerű) adatvizualizáció

2. (egyszerű) adatvizualizáció

2. adatvizualizáció

tudás

történetmesélés adatokkal

3. tudásvizualizáció

4. felhasználható tudás

5. ...

A hatalomhoz vezető út

  • A tudás hatalom
  • A tudáshoz sok információ kell
  • Az tudáshoz az információt helyesen kell összekapcsolni
  • Az információhoz sok adat kell
  • Az információhoz az adatokat helyesen kell értelmezni
  • Az adatok értelmezéséhez először meg kell azokat érteni
  • Az adatok megértéséhez helyesen kell őket megjeleníteni
  • Az adatok megjelenítéséhez helyesen kell őket elemezni
  • Welcome to Data Science

A vizualizáció értéke

1 ZB

ZETA-EXA-PETA

TERRA-GIGA-MEGA

Megértés | Feldolgozás | Értékkeresés | Vizualizáció | Kommunikáció

Fordítás

Memória

Megértés

Miért készítsünk adatvizualizációt?

A vizualizáció értéke

Tárol

Kielemez

Segíti a érvelést, gondolatmenetet

Közöl

Bevon

Meggyőz

"Figyelemszegénység"

Péntek délután 3 óra tájban Józsi unokatestvére a szentkirályi piacra menet találkozott a kék szemű Ágotával, aki egy barna ruhát viselt.

Kép-felsőbbrendűségi jelenség

Adat- és képmodellek

       Nyers adat   -    Adattábla   -  Vizuális strukturák - Nézetek

Adatátalakítás - Vizuális kódolás - Nézetalakítás

Adatmodell

Elképzelésmodell

N: Névleges - Nominális

O: Rendezett - Ordered

Q: Mérhető - Quantitative

együtt a modellek:

adatok kontextusba helyezése

Adatreferencia

(pandas: index)

Képi jelrendszer: vizuális nyelv

Hasonlóság, sorrend és méretarány e vizuális nyelv szófajai!

Fókusz

Áttetszőség

(Animáció)

Vizuális jelzők - az információ egyértelmű vizuális kódolása

Csapda: színek

A vizuális nyelv jelzőinek hierarchiája az adatmodellek kontextusában

Vizualizációs design-kritériumok

Félreértelmezhetetlen kifejezőség

Funkcionális hatékonyság

Adatmodell-specifikus

vizualizációs jelzőhierarchia

Grafikus- és színmodellek

Melyik négyszög világosabb?

Melyik négyszög világosabb?

212, 212, 212

207, 207, 207

Melyik kör "nagyobb"?

Mennyivel / Hányszor?

7

Érzékelés

intenzitásgörbéje:

Hatványtörvény

 

Nem lineáris!

Színmodellek

RGB

HEX

(0.8,0.2,0.4)

(204,51,102)

#CC3366

HSV

H: Szín - Hue

S: Telítettség - Saturation

V: Világosság - Value

Chromatic Adaptation

- Milyen színű a dinó?

-Attól függ...

A színkörnyezet befolyásolja

a színérzetet!

Crispening - the "background effect"

Finomélesítés

Szín-összeolvadás

Színtippek!

Vizualizáció típusok

Projektek

Egyéni projekt

  • Releváns probléma
  • Adatgyűjtésben/formázásban tud(t)ok segíteni
    • Készítünk egy adatbankot közösen
    • Határidő adatválasztásra Dec 10
    • Határidő adatnormalizálásra Dec 10
    • Sor-alapú formátumba kell transzformálni
    • Egye oszlop egy címke/attribútum
    • Meg kell határozni az oszlopok típusait
  • Exploratory viz / adatfelfedezés
  • Interaktív vizualizáció / Videóvizualizáció / Infografika
  • Hangsúly a tervezésen van, és miért az a legmegfelelőbb forma
  • Ezért fontos a probléma definiálása
  • Moddle-n fent lesz a leírás hamarosan

Csoportos projekt

  • 3-4 személy egy csoportban
  • Releváns probléma - feladatkörök megosztás
  • Interaktív vizualizáció / Videóvizualizáció / Infografika
  • Hangsúly a történetmesélésen van
  • Moddle-n fent lesz a leírás hamarosan
  • Beleegyzés alapján a legjobb munkákat publikáljuk a SZÉKELYDATA blog felüleletén
  • Illetve benevezhetőek az II. adatviz versenyre - monies

 

  • Egyéni: Max 6 oldal dolgozat, 3 perc bemutató
  • Csoport: Link, 5 perc bemutató
  • Határidő Január 17
  • Bemutatók Január 18

Csoportos projekt

  • Csoportok holnapra
  • Adatötletek - akkor is ha nem találtok semmit
    • Egyéni + csoport

Webfelület alapok

HTML | CSS | JavaScript

Konzol (console)

F12 | Ctrl + Shift + C | Cmd + J

<DIV>  <SPAN> #ID .CLASS

list (ul, ol, li), hr, br, form, input, select, iframe

D3plus

python -m SimpleHTTPServer

vagy

python -m http.server

Python

pandas

JSON

Adat workshop

Ha lesz időtök nézzétek meg/töltsétek le a következő szoftvereket:

Online Jupyter platformok:

Projektek bemutatása

3 perc / egyéni

5 perc / csoport

Wrap-up

BI kurzus Kolozsvár

By Dénes Csala

BI kurzus Kolozsvár

UBB FSEGA

  • 235
Loading comments...

More from Dénes Csala