2b
Kurs 2b Visa detaljer
8. Korrelation och kausalitet
Fortsätt till nästa lektion
Lektion
Övningar
Tester
Kapitel 5
8. 

Korrelation och kausalitet

Denna lektion granskar koncepten korrelation och kausalitet, två grundläggande aspekter av statistisk analys. Den förklarar vad korrelation innebär och hur det relaterar till kausalitet. Den ger en omfattande förståelse för hur dessa två koncept samspelar och påverkar varandra. Lektionenen vägleder dig också om hur man beräknar korrelationskoefficienten, ett viktigt statistiskt mått som kvantifierar graden av korrelation mellan två variabler. Den utforskar vidare exempel på orsak och verkan, vilket demonstrerar de praktiska tillämpningarna av dessa koncept i verkliga scenarier. Oavsett om du är en student, en forskare eller bara någon som är intresserad av statistik, erbjuder Denna lektion värdefulla insikter i dessa komplexa koncept.
Visa mer expand_more
Inställningar & verktyg för lektion
5 sidor teori
14 Uppgifter - Nivå 1 - 3
Varje lektion är menad motsvara 1-2 lektioner i klassrummet.
Korrelation och kausalitet
Sida av 5
Koncept

Korrelation

Om det finns ett samband mellan två eller fler faktorer säger man att de korrelerar. Det finns t.ex. en korrelation mellan längd och ålder (fram till att man slutar växa): ju äldre man är, desto längre är man. Detta kallas för positiv korrelation och innebär att om en variabel ökar så ökar även den andra. Om den ena variabeln däremot minskar när den andra ökar kallas det negativ korrelation.

Positiv korrelation: När x ökar, ökar också y (Spridningsdiagram med punkter nära en osynlig linje med positiv lutning); Negativ korrelation: När x ökar, minskar y (Spridningsdiagram med punkter nära en osynlig linje med negativ lutning); Ingen korrelation: Det finns inget samband mellan dataset, vilket resulterar i ett slumpmässigt mönster i spridningsdiagrammet (Spridningsdiagram med punkter på slumpmässiga positioner).

Ju mer datapunkterna ser ut att följa en viss trend, desto mer korrelerade säger man att de är. Om de ligger nästan exakt på en linje säger man att variablerna är starkt korrelerade medan om de är mer utspridda är de svagt korrelerade.

Korrelation innebär inte nödvändigtvis att det finns ett orsakssamband (kausalitet). De kan båda vara påverkade av en tredje faktor eller kan sambandet bero på slumpen.
Koncept

Korrelationskoefficient

Korrelationskoefficienten, är ett mått på hur stark en korrelation är. Den varierar mellan och Värden nära innebär att korrelationen är stark och negativ, medan en korrelation nära är stark och positiv. Har den värdet finns det ingen korrelation.

$r=1$: perfekt positiv korrelation; $r \in [0.75,1)$: stark positiv korrelation; $r \in [0.3,0.75)$: måttlig positiv korrelation; $r \in [0.15,0.3)$: svag positiv korrelation; $r \in [0,0.15)$: ingen korrelation; motsvarande för de negativa värdena.
När det finns en linjär modell som beskriver sambandet mellan två variabler väl, indikerar korrelationskoefficienten hur nära punkterna ligger den bästa anpassade linjen. Ju närmare värdet är eller desto närmare ligger punkterna den bästa anpassade linjen.
Grupp av punkter som rör sig när korrelationskoefficienten förändras

Exempel

Para ihop korrelation med rätt korrelationskoefficient

fullscreen

I koordinatsystemen visas spridningsdiagram mellan två parametrar.

Fyra diagram med olika kausalitetssamband
Para ihop lämplig korrelationskoefficient, med rätt diagram:
Visa Lösning expand_more

Vi tittar på diagrammen ett i taget.

A
Diagram visar en positiv korrelation, eftersom lutningen är positiv. Det är även en stark korrelation, eftersom punkterna ligger nära en tänkt rät linje. Därför är det korrelationskoefficienten som passar bäst.

B
Spridningsdiagram verkar inte ha någon positiv eller negativ trend. Därför är korrelationskoefficienten ungefär 0.

C och D
Både och visar på en negativ korrelation, eftersom det är en negativ lutning. Diagram har en starkare korrelation än eftersom det visar på en tydligare trend. Därför hör ihop med och med

Diagram
Koncept

Kausalitet

Kausalitet är ett orsakssamband mellan två korrelerade faktorer där den ena direkt påverkar den andra.
Ett exempel på en korrelation där det också finns ett orsakssamband är längd och ålder. Ju äldre man är, desto längre är man, i alla fall tills man slutar växa.

På vintern går både antalet villabränder och bilolyckor upp — de är korrelerade. Däremot kan man inte säga att villabränder får bilar att krocka. Anledningen är att vintern är en gemensam faktor som orsakar både halare väglag och att fler ljus tänds, vilket leder till fler eldsvådor. Det finns en korrelation mellan villabränder och bilolyckor, men ingen kausalitet.

Exempel

Finns det en kausalitet?

fullscreen

Anta att det finns en korrelation mellan följande parametrar.

  • Skostorlek och antal länder man besökt
  • Vikt och klädstorlek
  • Temperatur och antal människor på stranden
  • Mattebetyg och antal engelskglosor man kan

Diskutera om det även finns en kausalitet.

Visa Lösning expand_more

Vi går igenom fallen ett i taget.

Skostorlek och antal länder man besökt
Personer med stor skostorlek har inte nödvändigtvis besökt fler länder. En större skostorlek handlar antagligen snarare om att man är äldre och därmed hunnit med fler utlandsresor. Det råder alltså ingen kausalitet mellan skostorlek och hur många länder man besökt.

Vikt och klädstorlek
Människor som väger mer har generellt en större kropp och behöver därför köpa större klädstorlekar. Det råder alltså kausalitet mellan vikt och klädstorlek.

Temperatur och antal människor på stranden
Det är nog fler som blir badsugna när det är varmt. Det råder alltså kausalitet mellan dagstemperatur och antal människor på stranden.

Mattebetyg och antal engelskglosor man kan
Elever som kan många glosor i engelska är sannolikt ambitiösa och pluggar även mycket matematik. Men enbart kunskaper i engelska gör inte att man blir bättre i matematik. Det råder alltså ingen kausalitet mellan mattebetyg och antalet engelska glosor man kan.


Korrelation och kausalitet
Övningar
Laddar innehåll