MAB5: Tilastot ja todennäköisyys

TILASTOT

Tilastoksi sanotaan perusjoukon (esim. Espoon asukkaat) tilastoyksiköihin (esim. Maija Marttinen) liittyvien ominaisuuksien mittaustuloksia (esim. pituus).

 

Tavallisesti vielä helposti ymmärrettävään muotoon muokattuna (esim. sektoridiagrammi)

Tilastot

Tilastojen lukutaito

Tilastoja tutkittaessa pitää pohtia

  • miten tilasto on tehty
  •  

Tilastojen lukutaito

Tilastojen lukutaito

Tilastojen lukutaito

Oppilasryhmästä

  • 6 henkilöä saapui lukioon junalla,
  • 8 henkilöä polkupyörällä
  • 3 henkilöä mopolla
  • 3 henkilöä henkilöautolla
  • 13 henkilöä linja-autolla

Otoksen koko on 6+8+3+3+13=33 eli merkitään n=33

Esimerkki 1 Frekvenssi ja pylväsdiagrammi

Aineiston tilastomuuttuja on ”kulkuväline”.

Esitetään tilastomuuttujan arvot ja frekvenssit tilastojakaumana.

Kulkuväline Frekvenssi
Juna 6
Polkupyörä 8
Mopo 3
Henkilöauto 3
Linja-auto 13

Juna

Polkupyörä

Mopo

Henkilöauto

Linja-auto

Frekvenssi tarkoittaa havaintojen lukumäärää.

Pylväsdiagrammi

Esimerkki 2 Suhteellinen frekvenssi ja sektoridiagrammi

Kaikki kotitaloudet, 2012
Tuoteryhmä € / kotitalous
A01 Elintarvikkeet ja alkoholittomat juomat 4540
A02 Alkoholijuomat ja tupakka 794
A03 Vaatteet ja jalkineet 1177
A04 Asuminen ja energia 10047
A05 Kodin kalusteet, koneet ja tarvikkeet 1683
A06 Terveys 1130
A07 Liikenne 6111
A08 Tietoliikenne 903
A09 Kulttuuri ja vapaa-aika 3636
A10 Koulutus 59
A11 Hotellit, kahvilat ja ravintolat 1466
A12 Muut tavarat ja palvelut 4224
Yhteensä 35770

Lasketaan jokaiselle tuoteryhmälle suhteellinen frekvenssi.

Tuoteryhmän keskimääräiset kulut jaetaan keskimääräisillä kokonaiskuluilla ja saatu luku muutetaan prosenteiksi.

Kaikki kotitaloudet, 2012
Tuoteryhmä € / kotitalous
A01 Elintarvikkeet ja alkoholittomat juomat 4540
A02 Alkoholijuomat ja tupakka 794
... ...
Yhteensä 35770
\dfrac{4540}{35770} \approx 12,7 \ \%
\dfrac{794}{35770} \approx 2,2 \ \%

A01 Elintarvikkeet ja alkoholittomat juomat

A02 Alkoholijuomat ja tupakka

Kaikki kotitaloudet, 2012
Tuoteryhmä € / kotitalous %
A01 Elintarvikkeet ja alkoholittomat juomat 4540 12,7
A02 Alkoholijuomat ja tupakka 794 2,2
A03 Vaatteet ja jalkineet 1177 3,3
A04 Asuminen ja energia 10047 28,1
A05 Kodin kalusteet, koneet ja tarvikkeet 1683 4,7
A06 Terveys 1130 3,2
A07 Liikenne 6111 17,1
A08 Tietoliikenne 903 2,5
A09 Kulttuuri ja vapaa-aika 3636 10,2
A10 Koulutus 59 0,2
A11 Hotellit, kahvilat ja ravintolat 1466 4,1
A12 Muut tavarat ja palvelut 4224 11,8
Yhteensä 35770 100

Suhteellinen frekvenssi

Sektoridiagrammi

Tyyppiarvo eli moodi

Keskiarvo

Kulkuväline Frekvenssi
Juna 6
Polkupyörä 8
Mopo 3
Henkilöauto 3
Linja-auto 13

Moodi on aineiston yleisin havaintoarvo.

Oheisessa aineistossa moodi on Linja-auto

Arvosanojen 5, 5, 6, 7, 7, 8, 9 keskiarvo on

\overline{x}=\dfrac{5+5+6+7+7+8+9}{7}\approx 6,7

suurin frekvenssi!

Mediaani

Suuruusjärjestykseen laitetun aineiston keskimmäinen arvo.

Erään kurssin koearvosanat olivat 

5, 7, 5, 8, 8, 7, 6, 9, 9, 8, 8, 6, 7.

Mediaanin määrittämiseksi arvosanat pitää järjestää suuruusjärjestykseen.

5, 5, 6, 6, 7, 7, 7, 8, 8, 8, 8, 9, 9

Näin ollen mediaani on 7.

Esimerkki 3 

LibreOffice

Pylväsdiagrammin piirtäminen

Avaa LibreOffice Calc.

1. Kirjoita taulukkolaskentaohjelmalla taulukon tiedot, kuten alla olevassa kuvassa.

vuosi liikevaihto (miljoonaa) vuosi liikevaihto (miljoonaa)
2010 1,5 2014 1,5
2011 1,7 2015 3,1
2012 2,0 2016 3,5
2013 2,8

2. Luo kaavio.

Esimerkki 4

GeoGebra

Sektoridiagrammin piirtäminen

MAB5: Tilastot ja todennäköisyys 3/3

By Opetus.tv

MAB5: Tilastot ja todennäköisyys 3/3

  • 2,534