Hajontaluvut
| Lapsi | Ikä (kk) |
|---|---|
| 1 | 15 |
| 2 | 26 |
| 3 | 10 |
| 4 | 9 |
| 5 | 15 |
| 6 | 20 |
| 7 | 18 |
| 8 | 11 |
| 9 | 8 |
| 10 | 20 |
| 11 | 7 |
| 12 | 9 |
| 13 | 10 |
| 14 | 11 |
| 15 | 11 |
| 16 | 10 |
| 17 | 12 |
| 18 | 42 |
| 19 | 17 |
| 20 | 11 |
| 21 | 10 |
Taulukossa näkyy 21 eri lapsen iät kuukausina, jolloin lapsi puhui ensimmäistä kertaa
Kuinka paljon lasten iät poikkeavat toisistaan?

Paljonko lasten iät poikkeavat toisistaan?
Nuorin lapsista on 7 kk ja vanhin 42 kk,
eli vaihteluväli on [7, 42] kk.
Vanhimman ja nuorimman välinen ikäero,
eli vaihteluvälin pituus on siis 42 - 7 = 35 kk.
Ongelma: poikkeavat havainnot muuttavat
vaihteluväliä ja vaihteluvälin pituutta herkästi
Yksi ratkaisu: keskihajonta kertoo, mikä olisi "tavallista" vaihtelua. Taulukkolaskentaohjelmalla laskettuna se näyttäisi olevan 7,76 kk, mutta mitä se tarkoittaa?
(Populaation) keskihajonta (\(\sigma\)) on havaintoarvojen keskiarvosta laskettujen poikkeamien neliöiden keskiarvon neliöjuuri, eli
\(\sigma = \sqrt{\frac{(x_1-\bar{x})^2+(x_2-\bar{x})^2+...+(x_n-\bar{x})^2}{n}}\)
Otoksesta laskettaessa keskihajonta on kuitenkin otokseen suuntaan harhainen, jonka takia otoksesta yleensä lasketaan otoskeskihajonta (s)
\(s = \sqrt{\frac{(x_1-\bar{x})^2+(x_2-\bar{x})^2+...+(x_n-\bar{x})^2}{n-1}}\)
Huom! Taulukkolaskimessa keskihajonta on =KESKIHAJONTA() ja otoskeskihajonta =KESKIHAJONTA.S().
Tällä kurssilla käytetään aina otoskeskihajontaa
\(s = \sqrt{\frac{(x_1-\bar{x})^2+(x_2-\bar{x})^2+...+(x_n-\bar{x})^2}{n-1}}\)
Samalla tavalla kuin keskiarvo, keskihajontakin voidaan laskea frekvenssien avulla. Jos \(f_1,f_2,..,f_k\) on havaintomuuttujan mahdollisten arvojen \(x_1,x_2,..,x_k\) frekvenssit, niin
\(s = \sqrt{\frac{f_1(x_1-\bar{x})^2+f_2(x_2-\bar{x})^2+...+f_k(x_k-\bar{x})^2}{n-1}}\)
\(s= \sqrt{\frac{\sum\limits_{i=1}^k f_i(x_i-\bar{x})^2}{n-1}}\)
Summamerkin avulla kirjoitettuna:
Havainnon sanotaan poikkeavan merkittävästi, jos se on yli kahden keskihajonnan päässä keskiarvosta.

\(\bar{x}\)
\(\bar{x}+2s\)
\(\bar{x}-2s\)
Laske lukujen 3, 8, 7, 9 ja 33 otoskeskihajonta. Poikkeaako jokin luku merkittävästi?
\(s = \sqrt{\frac{(x_1-\bar{x})^2+(x_2-\bar{x})^2+...+(x_n-\bar{x})^2}{n-1}}\)
Lasketaan ensiksi keskiarvo:
\(\bar{x}=\dfrac{3+8+7+8+33}{5}=11{,}3\)
\(s=\sqrt{\dfrac{(3-11{,}3)^2+(8-11{,}3)^2+(7-11{,}3)^2+(9-11{,}3)^2+(33-11{,}3)^2}{5-1}}\)
\(\approx 10{,}82\)
Ei-poikkeavat havainnot ovat siis vähintään \(11{,}3-2\cdot10{,}82=-10{,}34\) ja enintään \(11{,}3+2\cdot10{,}82=32{,}94\), eli ne ovat välillä \([-10{,}34;32{,}94]\).
Luku 33 ei kuulu välille, joten se poikkeaa merkittävästi.

Kahden keskihajonnan päässä on normaalijakauman tapauksessa n. 95% havainnoista
05 Hajontaluvut
By Timo Pelkola
05 Hajontaluvut
- 58