Korrelation och kausalitet

{{ 'ml-heading-theory' | message }}

Begrepp

Korrelation

Om det finns ett samband mellan två eller fler faktorer säger man att de korrelerar. Det finns t.ex. en korrelation mellan längd och ålder (fram till att man slutar växa): ju äldre man är, desto längre är man. Detta kallas för positiv korrelation och innebär att om en variabel ökar så ökar även den andra. Om den ena variabeln däremot minskar när den andra ökar kallas det negativ korrelation.

Tre diagram som visar positiv, negativ och ingen korrelation

Ju mer datapunkterna ser ut att följa en viss trend, desto mer korrelerade säger man att de är. Om de ligger nästan exakt på en linje säger man att variablerna är starkt korrelerade medan om de är mer utspridda är de svagt korrelerade.

Tre diagram som visar stark, svag och ingen korrelation
Korrelation innebär inte nödvändigtvis att det finns ett orsakssamband (kausalitet). De kan båda vara påverkade av en tredje faktor eller kan sambandet bero på slumpen.
Begrepp

Korrelationskoefficient

Korrelationskoefficienten, r,r, är ett mått på hur stark en korrelation är. Den varierar mellan -1\text{-}1 och 1.1. Värden nära -1\text{-}1 innebär att korrelationen är stark och negativ, medan en korrelation nära 11 är stark och positiv. Har den värdet 0 finns det ingen korrelation.
Uppgift

I koordinatsystemen visas spridningsdiagram mellan två parametrar.

Fyra diagram med olika kausalitetssamband

Para ihop lämplig korrelationskoefficient, r,r, med rätt diagram:01-0.85-1. \sim 0 \quad \sim 1 \quad \sim \text{-} 0.85 \quad \sim \text{-} 1.

Lösning

Vi tittar på diagrammen ett i taget.

A
Diagram AA visar en positiv korrelation, eftersom lutningen är positiv. Det är även en stark korrelation, eftersom punkterna ligger nära en tänkt rät linje. Därför är det korrelationskoefficienten r1r \approx 1 som passar bäst.

B
Spridningsdiagram BB verkar inte ha någon positiv eller negativ trend. Därför är korrelationskoefficienten ungefär 0.

C och D
Både CC och DD visar på en negativ korrelation, eftersom det är en negativ lutning. Diagram DD har en starkare korrelation än C,C, eftersom det visar på en tydligare trend. Därför hör CC ihop med r-0.85r \approx \text{-}0.85 och DD med r-1.r \approx \text{-}1.

Diagram AA BB CC DD
rr 185\sim 1 \phantom{85} 085\sim 0 \phantom{85} -0.85\sim \text{-}0.85 -185\sim \text{-}1 \phantom{85}
Visa lösning Visa lösning
Begrepp

Kausalitet

Kausalitet är ett orsakssamband mellan två korrelerade faktorer där den ena direkt påverkar den andra.

 • Kausalitet finns: Ett exempel på en korrelation där det också finns ett orsakssamband är längd och ålder. Ju äldre man är, desto längre är man, i alla fall tills man slutar växa.
Kausalitet mellan ålder och längd
 • Ingen kausalitet: På vintern går både antalet villabränder och bilolyckor upp – de är korrelerade. Däremot kan man inte säga att villabränder får bilar att krocka. Anledningen är att vintern är en gemensam faktor som orsakar både halare väglag och att fler ljus tänds, vilket leder till fler eldsvådor. Det finns en korrelation mellan villabränder och bilolyckor, men ingen kausalitet.
Skillnad mellan korrelation och kausalitet
Uppgift

Anta att det finns en korrelation mellan följande parametrar.

 • Skostorlek och antal länder man besökt
 • Vikt och klädstorlek
 • Temperatur och antal människor på stranden
 • Mattebetyg och antal engelskglosor man kan

Diskutera om det även finns en kausalitet.

Lösning

Vi går igenom fallen ett i taget.

Skostorlek och antal länder man besökt
Personer med stor skostorlek har inte nödvändigtvis besökt fler länder. En större skostorlek handlar antagligen snarare om att man är äldre och därmed hunnit med fler utlandsresor. Det råder alltså ingen kausalitet mellan skostorlek och hur många länder man besökt.

Vikt och klädstorlek
Människor som väger mer har generellt en större kropp och behöver därför köpa större klädstorlekar. Det råder alltså kausalitet mellan vikt och klädstorlek.

Temperatur och antal människor på stranden
Det är nog fler som blir badsugna när det är varmt. Det råder alltså kausalitet mellan dagstemperatur och antal människor på stranden.

Mattebetyg och antal engelskglosor man kan
Elever som kan många glosor i engelska är sannolikt ambitiösa och pluggar även mycket matematik. Men enbart kunskaper i engelska gör inte att man blir bättre i matematik. Det råder alltså ingen kausalitet mellan mattebetyg och antalet engelska glosor man kan.

Visa lösning Visa lösning

Uppgifter

Nivå 1
1.1
{{ 'ml-btn-focusmode-tooltip' | message }} settings_overscan

I koordinatsystemen visas sex spridningsdiagram.

sex spridningsdiagram

Avgör vilka diagram som visar

a

stark respektive svag korrelation.

b

positiv respektive negativ korrelation.

1.2
{{ 'ml-btn-focusmode-tooltip' | message }} settings_overscan

Avgör om det kan finnas någon korrelation mellan variablerna. Om ja, beror det på att det finns en kausalitet?


a

Mängden äpplen du köper och priset du betalar

b

Vuxna personers vikt och sömnbehov

c

Antal datorer per invånare i ett land och landets medellivslängd

1.3
{{ 'ml-btn-focusmode-tooltip' | message }} settings_overscan

Anta att följande variabler är korrelerade. Avgör om korrelationen är positiv eller negativ, samt om det råder kausalitet eller inte.


a

Åldern på en björk och stammens diameter

b

Antal telefonkiosker och antal skickade SMS

c

Utomhustemperatur på vintern och antal frusna sjöar

1.4
{{ 'ml-btn-focusmode-tooltip' | message }} settings_overscan

I Tjorvens kiosk mätte man under en sommarvecka hur maxtemperaturen under dagen påverkade försäljningen av några olika vanliga varor.

Maxtemp Glass Korv Kaffe
1313 ^\circC 1515 2727 6767
16 16 ^\circC 1717 2525 6666
25 25 ^\circC 3030 3232 4040
33 33 ^\circC 6868 1717 1111
30 30 ^\circC 5757 88 1515
27 27 ^\circC 4545 4141 2323
20 20 ^\circC 2020 4040 6464

Avgör om det finns någon korrelation, och i så fall vilken typ, mellan maxtemperaturen och antal sålda


a

glassar.

b

korvar.

c

koppar kaffe.

1.5
{{ 'ml-btn-focusmode-tooltip' | message }} settings_overscan

Går det att avgöra om det finns korrelation mellan variablerna? Motivera.


a

Inkomst och lycka

b

Klädfärg och vikt

c

Skönhet och längd

Nivå 2
2.1
{{ 'ml-btn-focusmode-tooltip' | message }} settings_overscan

Antag att det finns en korrelation mellan följande variabler. Kan det även vara en kausalitet? Om inte, finns det någon annan gemensam variabel som skulle kunna förklara korrelationen?


a

Antal timmar du tränar och mängden kalorier du förbränner

b

Antal sålda glassar på en strand och antal fall av hudcancer

c

Antal utlandsresor och medellivslängd

d

Antal paraplyer och antal våta skor på stan

e

Antal rökare i ett land och antal fall av lungcancer

2.2
{{ 'ml-btn-focusmode-tooltip' | message }} settings_overscan

I koordinatsystemen visas fyra spridningsdiagram.

Fyra spridningsdiagram

Para ihop spridningsdiagram med lämplig korrelationskoefficient: 0.7  1  -1  -0.7  0. \sim 0.7\ \ \sim1\ \ \sim\text{-}1\ \ \sim\text{-}0.7\ \ \sim0.

2.3
{{ 'ml-btn-focusmode-tooltip' | message }} settings_overscan

I figuren finns fyra olika spridningsdiagram.

Fyra olika spridningsdiagram, vissa med korrelation


a

Avgör vilka av diagrammen som visar svag eller stark samt positiv eller negativ korrelation.

b

Para ihop graferna med det alternativ som diagrammet bäst skulle kunna representera:

 1. Utomhustemperatur och elkostnad
 2. Dag på året man fyller år och antal koppar te/år
 3. Ålder på vuxna och antal hårstrån på huvudet
 4. Tid man åkt tåg och sträckan man färdats från start
 5. Antal dagar efter lön och pengar på kontot
2.4
{{ 'ml-btn-focusmode-tooltip' | message }} settings_overscan

Samira har undersökt månadslön och ålder för tio anställda på ett företag. Resultatet visas i tabellen.

Ålder (år) Månadslön (kr)
2323 2200022\,000
3030 2800028\,000
3131 2700027\,000
5454 3900039\,000
1818 1900019\,000
2121 5900059\,000
6363 4100041\,000
2828 3000030\,000
2020 1900019\,000
4242 3200032\,000

Är åldern och månadslönen korrelerade? Diskutera. Lös uppgiften utan räknare.

2.5
{{ 'ml-btn-focusmode-tooltip' | message }} settings_overscan

En ekonomielev ska göra ett reportage i skoltidningen om att kommunen satsar allt mindre av skattepengarna på skolan. På kommunens hemsida hittar hon statistik över hur pengarna fördelats de senaste åren.

År Skola Äldre Infrastr. Övrigt
20102010 45%45\, \% 31%31\, \% 7%7\, \% 17%17\, \%
20112011 44%44\, \% 32%32\, \% 7%7\, \% 17%17\, \%
20122012 42%42\, \% 34%34\, \% 8%8\, \% 16%16\, \%
20132013 41%41\, \% 33%33\, \% 9%9\, \% 17%17\, \%
20142014 40%40\, \% 32%32\, \% 9%9\, \% 19%19\, \%
20152015 39%39\, \% 31%31\, \% 9%9\, \% 21%21\, \%
20162016 38%38\, \% 35%35\, \% 10%10\, \% 17%17\, \%

Hon skriver artikeln som får rubriken Skolans resurser minskar på bekostnad av de äldre. Har hon rätt, eller finns det något annat mer korrekt att beskriva det på? Motivera ditt svar.

2.6
{{ 'ml-btn-focusmode-tooltip' | message }} settings_overscan

Melker ritar upp funktionen y=2x+1.y=2x+1.

Hans kompis Freja säger, "Titta, alla punkter ligger perfekt på en rät linje. Därför måste xx och yy vara helt korrelerade!" Har Freja rätt?

Nivå 3
3.1
{{ 'ml-btn-focusmode-tooltip' | message }} settings_overscan

Jafar gör ett arbete om hållbar utveckling och har ritat upp några olika spridningsdiagram.

Sex olika spridningsdiagram

Han får låna ett program på sin mammas jobbdator för att ta fram tre olika korrelationskoefficienter.

Rutat papper med korrelationskoefficienter

När han kommer hem och tittar på sina grafer inser han att han har glömt vilka grafer det var han undersökte, och arbetet ska in samma kväll kl 23:59! Hjälp honom att para ihop rätt korrelationskoefficient med rätt graf, och motivera noga så att Jafar litar på dina slutsatser!

3.2
{{ 'ml-btn-focusmode-tooltip' | message }} settings_overscan

Thorvald har gjort ett spridningsdiagram för två faktorer, xx och y.y.

Spridningsdiagram som följer en horisontell linje

Datapunkterna följer nästan exakt en rät linje. Thorvald säger då att xx och yy måste vara starkt korrelerade. Hans kamrat Björn säger att de inte alls är korrelerade. Vem har rätt? Motivera ditt svar.

Nivå 4
4.1
{{ 'ml-btn-focusmode-tooltip' | message }} settings_overscan

Du ska undersöka om en ny typ av medicin är verksam på personer med högt blodtryck.


a

Hur kan du avgöra om det finns en korrelation mellan tiden som patienten ätit medicinen och blodtrycksvärde (mäts i mmHg)?

b

Om det finns en korrelation, ge ett exempel på hur du kan avgöra om det även finns kausalitet, dvs. att förbättringen berodde på medicinen.

Test
{{ 'mldesktop-selftest-notests' | message }} {{ article.displayTitle }}!
{{ tests.error }}

{{ 'ml-heading-exercise' | message }} {{ focusmode.exercise.exerciseName }}

keyboard_backspace
{{ section.title }} keyboard_backspace {{ 'ml-btn-previous' | message }} {{ 'ml-btn-previous-exercise' | message }} {{ 'ml-btn-next-exercise' | message }} keyboard_backspace {{ 'ml-btn-next-exercise' | message }}