2b
Kurs 2b Visa detaljer
8. Korrelation och kausalitet
Fortsätt till nästa lektion
Lektion
Övningar
Tester
Kapitel 5
8. 

Korrelation och kausalitet

Denna lektion granskar koncepten korrelation och kausalitet, två grundläggande aspekter av statistisk analys. Den förklarar vad korrelation innebär och hur det relaterar till kausalitet. Den ger en omfattande förståelse för hur dessa två koncept samspelar och påverkar varandra. Lektionenen vägleder dig också om hur man beräknar korrelationskoefficienten, ett viktigt statistiskt mått som kvantifierar graden av korrelation mellan två variabler. Den utforskar vidare exempel på orsak och verkan, vilket demonstrerar de praktiska tillämpningarna av dessa koncept i verkliga scenarier. Oavsett om du är en student, en forskare eller bara någon som är intresserad av statistik, erbjuder Denna lektion värdefulla insikter i dessa komplexa koncept.
Visa mer expand_more
Begrepp Modellering Problemlösning Procedur Resonemang och Kommunikation
Inställningar & verktyg för lektion
7 sidor teori
14 Uppgifter - Nivå 1 - 3
Varje lektion är menad motsvara 1-2 lektioner i klassrummet.
Korrelation och kausalitet
Sida av 7
Teori

Korrelation och kausalitet

I den här lektionen går vi igenom följande begrepp:

  • Korrelation
  • Korrelationskoefficient
  • Kausalitet
Koncept

Korrelation

Om det finns ett samband mellan två eller fler faktorer säger man att de korrelerar. Det finns t.ex. en korrelation mellan längd och ålder (fram till att man slutar växa): ju äldre man är, desto längre är man. Detta kallas för positiv korrelation och innebär att om en variabel ökar så ökar även den andra. Om den ena variabeln däremot minskar när den andra ökar kallas det negativ korrelation.

Positiv korrelation: När x ökar, ökar också y (Spridningsdiagram med punkter nära en osynlig linje med positiv lutning); Negativ korrelation: När x ökar, minskar y (Spridningsdiagram med punkter nära en osynlig linje med negativ lutning); Ingen korrelation: Det finns inget samband mellan dataset, vilket resulterar i ett slumpmässigt mönster i spridningsdiagrammet (Spridningsdiagram med punkter på slumpmässiga positioner).

Ju mer datapunkterna ser ut att följa en viss trend, desto mer korrelerade säger man att de är. Om de ligger nästan exakt på en linje säger man att variablerna är starkt korrelerade medan om de är mer utspridda är de svagt korrelerade. För att mäta korrelationen mellan två variabler använder man en korrelationskoefficient.

Koncept

Korrelationskoefficient

Korrelationskoefficienten, är ett mått på hur stark en korrelation är. Den varierar mellan och Värden nära innebär att korrelationen är stark och negativ, medan en korrelation nära är stark och positiv. Har den värdet finns det ingen korrelation.

$r=1$: perfekt positiv korrelation; $r \in [0.75,1)$: stark positiv korrelation; $r \in [0.3,0.75)$: måttlig positiv korrelation; $r \in [0.15,0.3)$: svag positiv korrelation; $r \in [0,0.15)$: ingen korrelation; motsvarande för de negativa värdena.
När det finns en linjär modell som beskriver sambandet mellan två variabler väl, indikerar korrelationskoefficienten hur nära punkterna ligger den bästa anpassade linjen. Ju närmare värdet är eller desto närmare ligger punkterna den bästa anpassade linjen.
Grupp av punkter som rör sig när korrelationskoefficienten förändras
Exempel

Para ihop korrelation med rätt korrelationskoefficient

I koordinatsystemen visas spridningsdiagram mellan två parametrar.

Fyra diagram med olika kausalitetssamband
Para ihop lämplig korrelationskoefficient, med rätt diagram:

Ledtråd

Se om punkterna bildar ett linjärt mönster. En positiv lutning betyder positiv korrelation, en negativ lutning betyder negativ korrelation, och inget tydligt mönster betyder att korrelationen är nära noll.

Lösning


Vi tittar på diagrammen ett i taget.

Diagram

Diagram visar en positiv korrelation, eftersom lutningen är positiv. Det är även en stark korrelation, eftersom punkterna ligger nära en tänkt rät linje.

Därför är det korrelationskoefficienten som passar bäst.

Diagram

Spridningsdiagram verkar inte ha någon positiv eller negativ trend.

Därför är korrelationskoefficienten ungefär

och

Både och visar på en negativ korrelation, eftersom det är en negativ lutning. Diagram har en starkare korrelation än eftersom det visar på en tydligare trend.

Fyra diagram med olika kausalitetssamband

Därför hör ihop med och med

Diagram
Koncept

Kausalitet

Kausalitet är ett orsakssamband mellan två korrelerade faktorer där den ena direkt påverkar den andra.
Ett exempel på en korrelation där det också finns ett orsakssamband är längd och ålder. Ju äldre man är, desto längre är man, i alla fall tills man slutar växa.

På vintern går både antalet villabränder och bilolyckor upp — de är korrelerade. Däremot kan man inte säga att villabränder får bilar att krocka. Anledningen är att vintern är en gemensam faktor som orsakar både halare väglag och att fler ljus tänds, vilket leder till fler eldsvådor. Det finns en korrelation mellan villabränder och bilolyckor, men ingen kausalitet.

Exempel

Finns det en kausalitet?

Anta att det finns en korrelation mellan följande parametrar.

  • Skostorlek och antal länder man besökt
  • Vikt och klädstorlek
  • Temperatur och antal människor på stranden
  • Mattebetyg och antal engelskglosor man kan
Diskutera om det även finns en kausalitet.

Svar

Se lösning.

Ledtråd

En stark korrelation betyder inte kausalitet. Kontrollera om en variabel kan påverka den andra, eller om båda är kopplade till en tredje faktor.

Lösning

Vi går igenom fallen ett i taget.

Skostorlek och antal länder man besökt

Personer med stor skostorlek har inte nödvändigtvis besökt fler länder. En större skostorlek handlar antagligen snarare om att man är äldre och därmed hunnit med fler utlandsresor. Det råder alltså ingen kausalitet mellan skostorlek och hur många länder man besökt.

Vikt och klädstorlek

Människor som väger mer har generellt en större kropp och behöver därför köpa större klädstorlekar. Det råder alltså kausalitet mellan vikt och klädstorlek.

Temperatur och antal människor på stranden

Det är nog fler som blir badsugna när det är varmt. Det råder alltså kausalitet mellan dagstemperatur och antal människor på stranden.

Mattebetyg och antal engelskglosor man kan

Elever som kan många glosor i engelska är sannolikt ambitiösa och pluggar även mycket matematik. Men enbart kunskaper i engelska gör inte att man blir bättre i matematik. Det råder alltså ingen kausalitet mellan mattebetyg och antalet engelska glosor man kan.

Övning

Identifiera korrelationer från spridningsdiagram

Följande applet visar olika spridningsdiagram. Välj den typ av korrelation som stämmer med det visade diagrammet.

En applet som ber användaren identifiera vilken typ av korrelation som visas
Korrelation och kausalitet
Övningar