Korrelaatio

Kertauksena: Selitysaste (\(r^2\)) on luku 0:n ja 1:n väliltä, joka kertoo, kuinka hyvin sovitettu funktio sopii havaintoaineistoon

Korrelaatiokerroin (\(r\)) on luku -1:n ja 1:n välillä, jonka itseisarvo kertoo kuinka hyvin lineaarinen malli sopii havaintoaineistoon, ts. kuinka vahvaa on kahden muuttuja välinen lineaarinen riippuvuus.

Lineaarisen mallin tapauksessa selitysaste on korrelaation neliö.

Lineaarisen mallin tapauksessa selitysaste on korrelaation neliö.

Korrelaatiokertoimen itseisarvo saadaan selitysasteen neliöjuurena, korrelaation etumerkki taas on sama kuin sovitettavan suoran kulmakertoimella.

Esim. vasemmalla \(r=\sqrt{0{,}98}\approx 0{,}99\), oikealla \(r=-\sqrt{0,599}\approx -0{,}77\).

Esim. vasemmalla \(r=\sqrt{0{,}98}\approx 0{,}99\), oikealla \(r=-\sqrt{0,599}\approx -0{,}77\).

Taulukkolaskimessa korrelaatiokertoimen voi laskea myös suoraan komennolla =KORRELAATIO(A2:A42;B2:B42), jos yhden muuttujan arvot on soluissa A2-A42 ja toisen B2-42.

riippuvuus:
\(\left|r\right|\)

merkityksetön    kohtalainen      huomattava        voimakas

0                 0,3               0,6               0,8                 1

Lineaarisen riippuvuuden/korrelaation voimakkuutta voidaan kuvata sanallisesti seuraavan kirjasta ja MAOLin taulukkokirjasta löytyvän asteikon avulla:

Huom.
1) Korrelaatiokerroin ei ole sama asia kuin sovitettavan suoran kulmakerroin! Kulmakerroin kuvaa suoran jyrkkyyttä, korrelaatiokerroin kuinka hyvin pisteet sopivat suoralle.

2) Korrelaatiokerroin kuvaa vain lineaarista riippuvuutta, ei riippuvuutta yleensä.

Korrelaatio \(\neq\) kausaatio

eli korrelaatiosta ei saa päätellä syy-seuraussuhdetta!

jäätelön kulutus / kk

hukkumiset / kk

Hukkumisen ja jäätelön kulutuksen välillä on positiivinen korrelaatio, mutta hukkuminen ei ole seurausta jäätelön syönnistä! Korrelaation selittää kesä.

Taulukossa on yrityksen somemainontaan kuukaudessa käyttämä raha ja kuukauden myynti euroina. Mikä on mainonnan ja myynnin välinen korrelaatiokerroin? Onko korrelaatio positiivista vai negatiivista? Kuinka vahvaa korrelaatio on?

Mainonta (€) Myynti (€)
1300 15362
1800 20212
2200 21951
2300 24162

Solussa C2 kaava =KORRELAATIO(A2:A5;B2:B5)

V: Korrelaatiokerroin on 0,98, eli korrelaatio on positiivista ja voimakasta.

Calc:

riippuvuus:
\(\left|r\right|\)

merkityksetön    kohtalainen      huomattava        voimakas

0                 0,3               0,6               0,8                 1

Geogebra:

Muistutuksena:

Selitysaste (\(R^2\)) riippuu aina sovitettavasta mallista, eikä selitysaste ole korrelaatiokertoimen (\(r\)) neliö kuin lineaarisen mallin tapauksessa.

07 Korrelaatio

By Timo Pelkola

07 Korrelaatio

  • 62