{{ 'ml-label-loading-course' | message }}
{{ toc.name }}
{{ toc.signature }}
{{ tocHeader }} {{ 'ml-btn-view-details' | message }}
{{ tocSubheader }}
{{ 'ml-toc-proceed-mlc' | message }}
{{ 'ml-toc-proceed-tbs' | message }}
Lektion
Övningar
Rekommenderade
Tester
Ett fel uppstod, försök igen senare!
Kapitel {{ article.chapter.number }}
{{ article.number }}. 

{{ article.displayTitle }}

{{ article.intro.summary }}
Visa mindre Visa mer expand_more
{{ ability.description }} {{ ability.displayTitle }}
Inställningar & verktyg för lektion
{{ 'ml-lesson-number-slides' | message : article.intro.bblockCount }}
{{ 'ml-lesson-number-exercises' | message : article.intro.exerciseCount }}
{{ 'ml-lesson-time-estimation' | message }}
I den här lektionen går vi igenom följande begrepp:
  • Korrelation
  • Korrelationskoefficient
  • Kausalitet
  • Spridningsdiagram

Förkunskaper

Teori

Spridningsdiagram

Ett spridningsdiagram är ett sätt att visualisera mätdata med två parametrar i ett koordinatsystem. Om man t.ex. mäter höjden på tomatplantor vid olika tidpunkter får man ett antal datapunkter som kan markeras i ett koordinatsystem med tiden som koordinat och höjden som koordinat. Då har man gjort ett spridningsdiagram.

Varje punkt i diagrammet motsvaras av höjden på en planta efter en viss tid. Spridningsdiagram används bland annat för att avgöra om det finns en korrelation mellan två variabler och för att anpassa matematiska modeller till mätdata genom regression.
Teori

Korrelation

Om det finns ett samband mellan två eller fler faktorer säger man att de korrelerar. Det finns t.ex. en korrelation mellan längd och ålder (fram till att man slutar växa): ju äldre man är, desto längre är man. Detta kallas för positiv korrelation och innebär att om en variabel ökar så ökar även den andra. Om den ena variabeln däremot minskar när den andra ökar kallas det negativ korrelation.

Positiv korrelation: När x ökar, ökar också y (Spridningsdiagram med punkter nära en osynlig linje med positiv lutning); Negativ korrelation: När x ökar, minskar y (Spridningsdiagram med punkter nära en osynlig linje med negativ lutning); Ingen korrelation: Det finns inget samband mellan dataset, vilket resulterar i ett slumpmässigt mönster i spridningsdiagrammet (Spridningsdiagram med punkter på slumpmässiga positioner).

Ju mer datapunkterna ser ut att följa en viss trend, desto mer korrelerade säger man att de är. Om de ligger nästan exakt på en linje säger man att variablerna är starkt korrelerade medan om de är mer utspridda är de svagt korrelerade.

Teori

Korrelationskoefficient

Korrelationskoefficienten, är ett mått på hur stark en korrelation är. Den varierar mellan och Värden nära innebär att korrelationen är stark och negativ, medan en korrelation nära är stark och positiv. Har den värdet finns det ingen korrelation.

$r=1$: perfekt positiv korrelation; $r \in [0.75,1)$: stark positiv korrelation; $r \in [0.3,0.75)$: måttlig positiv korrelation; $r \in [0.15,0.3)$: svag positiv korrelation; $r \in [0,0.15)$: ingen korrelation; motsvarande för de negativa värdena.
När det finns en linjär modell som beskriver sambandet mellan två variabler väl, indikerar korrelationskoefficienten hur nära punkterna ligger den bästa anpassade linjen. Ju närmare värdet är eller desto närmare ligger punkterna den bästa anpassade linjen.
Grupp av punkter som rör sig när korrelationskoefficienten förändras
Exempel

Para ihop korrelation med rätt korrelationskoefficient

I koordinatsystemen visas spridningsdiagram mellan två parametrar.

Para ihop lämplig korrelationskoefficient, med rätt diagram:

Ledtråd

Värden nära innebär att korrelationen är stark och negativ, medan en korrelation nära är stark och positiv. Har den värdet finns det ingen korrelation.

Lösning

Vi tittar på diagrammen ett i taget.

Diagram A

Diagram A visar en positiv korrelation, eftersom lutningen är positiv. Det är även en stark korrelation, eftersom punkterna ligger nära en tänkt rät linje. Därför är det korrelationskoefficienten som passar bäst.

Diagram B

Spridningsdiagram B verkar inte ha någon positiv eller negativ trend. Därför är korrelationskoefficienten ungefär

Diagram C och D

Både C och D visar på en negativ korrelation, eftersom det är en negativ lutning. Diagram D har en starkare korrelation än C, eftersom det visar på en tydligare trend. Därför hör C ihop med och D med

Diagram
A
B
C
D
Teori

Kausalitet

Kausalitet är ett orsakssamband mellan två korrelerade faktorer där den ena direkt påverkar den andra.
Ett exempel på en korrelation där det också finns ett orsakssamband är längd och ålder. Ju äldre man är, desto längre är man, i alla fall tills man slutar växa.

På vintern går både antalet villabränder och bilolyckor upp — de är korrelerade. Däremot kan man inte säga att villabränder får bilar att krocka. Anledningen är att vintern är en gemensam faktor som orsakar både halare väglag och att fler ljus tänds, vilket leder till fler eldsvådor. Det finns en korrelation mellan villabränder och bilolyckor, men ingen kausalitet.

Exempel

Finns det kausalitet?

Anta att det finns en korrelation mellan följande parametrar.
I vilka fall finns det kausalitet?

Ledtråd

Bestäm om en parameter orsakar den andra.

Lösning

Analysera fallen ett i taget.

Fall A

Den första situationen föreslår att det finns en korrelation mellan de arbetade timmarna och den mängd pengar som tjänas. Vanligtvis beror mängden pengar någon tjänar på antalet arbetade timmar. Detta innebär att det finns ett kausalt samband.

Fall B

Den andra situationen föreslår att det finns en korrelation mellan en students höjd och deras favoritmat. När det gäller favoritmat beror det på personlig preferens. Å andra sidan beror höjden på genetik, inte på maten. Detta innebär att det inte finns ett kausalt samband.

Fall C

Målen kan referera till många sporter. Låt oss överväga fotboll. Traditionellt bär anfallare och offensiva spelare lägre nummer som och Dock har numret på tröjan ingen effekt på de mål som görs. Då finns det inte något kausalt samband.

Fall D

När man gör träning som att springa, förbränner vi kalorier. Dessutom, ju mer tid som spenderas på träning, desto fler kalorier förväntas förbrännas. Detta indikerar ett kausalt samband.

Laddar innehåll