Korrelaatio
Kertauksena: Selitysaste (\(r^2\)) on luku 0:n ja 1:n väliltä, joka kertoo, kuinka hyvin sovitettu funktio sopii havaintoaineistoon

Korrelaatiokerroin (\(r\)) on luku -1:n ja 1:n välillä, jonka itseisarvo kertoo kuinka hyvin lineaarinen malli sopii havaintoaineistoon, ts. kuinka vahvaa on kahden muuttuja välinen lineaarinen riippuvuus.
Lineaarisen mallin tapauksessa selitysaste on korrelaation neliö.


Lineaarisen mallin tapauksessa selitysaste on korrelaation neliö.
Korrelaatiokertoimen itseisarvo saadaan selitysasteen neliöjuurena, korrelaation etumerkki taas on sama kuin sovitettavan suoran kulmakertoimella.
Esim. vasemmalla \(r=\sqrt{0{,}98}\approx 0{,}99\), oikealla \(r=-\sqrt{0,599}\approx -0{,}77\).


Esim. vasemmalla \(r=\sqrt{0{,}98}\approx 0{,}99\), oikealla \(r=-\sqrt{0,599}\approx -0{,}77\).
Taulukkolaskimessa korrelaatiokertoimen voi laskea myös suoraan komennolla =KORRELAATIO(A2:A42;B2:B42), jos yhden muuttujan arvot on soluissa A2-A42 ja toisen B2-42.

riippuvuus:
\(\left|r\right|\)
merkityksetön kohtalainen huomattava voimakas
0 0,3 0,6 0,8 1
Lineaarisen riippuvuuden/korrelaation voimakkuutta voidaan kuvata sanallisesti seuraavan kirjasta ja MAOLin taulukkokirjasta löytyvän asteikon avulla:
Huom.
1) Korrelaatiokerroin ei ole sama asia kuin sovitettavan suoran kulmakerroin! Kulmakerroin kuvaa suoran jyrkkyyttä, korrelaatiokerroin kuinka hyvin pisteet sopivat suoralle.
2) Korrelaatiokerroin kuvaa vain lineaarista riippuvuutta, ei riippuvuutta yleensä.
Korrelaatio \(\neq\) kausaatio
eli korrelaatiosta ei saa päätellä syy-seuraussuhdetta!
jäätelön kulutus / kk
hukkumiset / kk
Hukkumisen ja jäätelön kulutuksen välillä on positiivinen korrelaatio, mutta hukkuminen ei ole seurausta jäätelön syönnistä! Korrelaation selittää kesä.

Taulukossa on yrityksen somemainontaan kuukaudessa käyttämä raha ja kuukauden myynti euroina. Mikä on mainonnan ja myynnin välinen korrelaatiokerroin? Onko korrelaatio positiivista vai negatiivista? Kuinka vahvaa korrelaatio on?
| Mainonta (€) | Myynti (€) |
|---|---|
| 1300 | 15362 |
| 1800 | 20212 |
| 2200 | 21951 |
| 2300 | 24162 |

Solussa C2 kaava =KORRELAATIO(A2:A5;B2:B5)
V: Korrelaatiokerroin on 0,98, eli korrelaatio on positiivista ja voimakasta.
Calc:
riippuvuus:
\(\left|r\right|\)
merkityksetön kohtalainen huomattava voimakas
0 0,3 0,6 0,8 1
Geogebra:


Muistutuksena:
Selitysaste (\(R^2\)) riippuu aina sovitettavasta mallista, eikä selitysaste ole korrelaatiokertoimen (\(r\)) neliö kuin lineaarisen mallin tapauksessa.
07 Korrelaatio
By Timo Pelkola
07 Korrelaatio
- 62