Keski- ja hajontaluvut

Keskiluvut

Moodi (Mo)

tyyppiarvo

  • aineiston yleisin arvo
  • se muuttujan arvo, jonka frekvenssi on suurin
  • jos useammalla muuttujan arvolla on sama suurin frekvenssi, kutsutaan kaikkia moodiksi
  • jos kyseessä on luokiteltu aineisto, moodiksi ilmoitetaan moodiluokka eli se luokka, jonka frekvenssi on suurin

arvosana

frekvenssi

4

5

6

7

8

9

10

2

1

3

6

4

3

1

20

Arvosanan 7 frekvenssi on suurin, joten

\text{Mo}=7

Mediaani (Md)

  • aineiston keskimmäinen arvo
  • aineisto järjestetään suuruusjärjestykseen ja etsitään keskimmäinen arvoista
  • muuttujan oltava järjestysasteikollinen!
  • jos aineistossa on parillinen määrä arvoja, mediaani on keskimmäisten arvojen keskiarvo

arvosana

frekvenssi

4

5

6

7

8

9

10

2

1

3

6

4

3

1

20

4, 4, 5, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 9, 9, 9, 10

Aineistossa on parillinen määrä arvoja, joten

\text{Md}=\frac{7+7}2=7

Keskiarvo

(\overline x)

arvosana

frekvenssi

4

5

6

7

8

9

10

2

1

3

6

4

3

1

20

  • Lasketaan kaikki arvot yhteen ja jaetaan summa arvojen lukumäärällä
  • Jos aineistosta on tehty tilastojakauma, keskiarvo voidaan laskea frekvenssejä käyttäen (kyseessä nk. painotettu keskiarvo) 
\overline{x}=\frac{2\cdot 4 + 1 \cdot 5 + 3 \cdot 6 + 6 \cdot 7 + 4 \cdot 8 + 3 \cdot 9 + 1 \cdot 10}{20}

Kyseisen matematiikan kurssin kurssiarvosanojen keskiarvo on

=\frac{142}{20}
=7,1

Tehtävä

Tutki seuraavia pylväsdiagrammeja ja pohdi
a) mitkä keskiluvut kuvaavat parhaiten kyseisen diagrammin aineistoa
b) mitä kukin keskiluku kertoo aineistosta
c) mitä keskiluvut eivät kerro.

Ratkaisu

Hajontaluvut

  • kuvaavat, miten havaintoarvot ovat hajaantuneet keskiluvun ympärille
  • esimerkiksi vaihteluväli ja keskihajonta

Tehtävä

Neljän eri tentin arvosanat jakautuvat seuraavasti:

a) Minkä tentin keskiarvo oli korkein?

b) Miten jakaumat eroavat toisistaan, ja miten eroja voitaisiin selittää?

a) Tentin 1 keskiarvo on 4,4583.
Tentin 2 keskiarvo on 3,22.
Tentin 3 keskiarvo on 3,78.
Tentin 4 keskiarvo on 4,4615.
Vastaus: Tentin 4 keskiarvo on korkein.


b) Tenteissä 1 ja 4 on lähes sama keskiarvo, mutta tentissä 1 menestyttiin paremmin: 24 osallistujasta vain kuusi sai arvosanaa 5 heikomman arvosanan. Tentissä 4 sen sijaan 10 osallistujaa 26:sta sai arvosanaa 5 heikomman tuloksen.

Tentin 2 keskiarvo ei kerro mitään, sillä tentistä sai joko arvosanan 1 tai arvosanan 5.

Tentin 3 keskiarvo sen sijaan kuvaa aineistoa hyvin, koska 24 osallistujasta 7 henkilöä sai arvosanan 3 tai 4 ja lähes yhtä monta sitä huonommin tai paremmin.

Ratkaisu

Vaihteluväli

  • ulottuu aineiston pienimmästä arvosta suurimpaan arvoon
  • vaihteluvälin pituus on suurimman ja pienimmän havaintoarvon erotus
  • vaihteluväli ja vaihteluvälin pituus antaa aineistoon tutustuvalle käsityksen muuttujan jakaumasta, mutta ne eivät kerro kovin paljoa

 

Esim.

Erään ryhmän arvosanat olivat 4, 7, 7, 7, 7, 7, 7, 10. Aineiston vaihteluvälin pituus on 10 - 4 = 6.

Keskipoikkeama

  • havaintoarvon poikkeama keskiarvosta
  • keskimääräinen poikkeama saadaan, kun keskipoikkeamista lasketaan keskiarvo
|x_i-\overline{x}|

Keskipoikkeama

Keskihajonta

  • Havaintoarvojen hajonnan mittalukuna käytetään keskihajontaa.
s_n=\sqrt{\dfrac{\sum(x_i-\overline{x})^2}{n}}

Esim.

Laske pituuksien 160 cm, 170 cm, 180 cm, 190 cm keskihajonta.

\overline{x}=\dfrac{160+170+180+190}{4}=175

1. Lasketaan keskiarvo

2. Lasketaan poikkeamien neliöiden keskiarvo

\dfrac{(175-160)^2+(175-170)^2+(175-180)^2+(175-190)^2}{4}
=\dfrac{15^2+5^2+(-5)^2+(-15)^2}{4}
=\dfrac{225+25+25+225}{4}
=\dfrac{500}{4}
=125

3. Lasketaaan keskihajonta

\sqrt{\dfrac{125}{4}}=\sqrt{31,25}\approx 5,59