Logga in
| 5 sidor teori |
| 14 Uppgifter - Nivå 1 - 3 |
| Varje lektion är menad motsvara 1-2 lektioner i klassrummet. |
Om det finns ett samband mellan två eller fler faktorer säger man att de korrelerar. Det finns t.ex. en korrelation mellan längd och ålder (fram till att man slutar växa): ju äldre man är, desto längre är man. Detta kallas för positiv korrelation och innebär att om en variabel ökar så ökar även den andra. Om den ena variabeln däremot minskar när den andra ökar kallas det negativ korrelation.
Ju mer datapunkterna ser ut att följa en viss trend, desto mer korrelerade säger man att de är. Om de ligger nästan exakt på en linje säger man att variablerna är starkt korrelerade medan om de är mer utspridda är de svagt korrelerade.
Korrelationskoefficienten, r, är ett mått på hur stark en korrelation är. Den varierar mellan −1 och 1. Värden nära −1 innebär att korrelationen är stark och negativ, medan en korrelation nära 1 är stark och positiv. Har den värdet 0 finns det ingen korrelation.
I koordinatsystemen visas spridningsdiagram mellan två parametrar.
Vi tittar på diagrammen ett i taget.
A
Diagram A visar en positiv korrelation, eftersom lutningen är positiv. Det är även en stark korrelation, eftersom punkterna ligger nära en tänkt rät linje. Därför är det korrelationskoefficienten r≈1 som passar bäst.
B
Spridningsdiagram B verkar inte ha någon positiv eller negativ trend. Därför är korrelationskoefficienten ungefär 0.
C och D
Både C och D visar på en negativ korrelation, eftersom det är en negativ lutning. Diagram D har en starkare korrelation än C, eftersom det visar på en tydligare trend. Därför hör C ihop med r≈−0.85 och D med r≈−1.
Diagram | A | B | C | D |
---|---|---|---|---|
r | ∼185 | ∼085 | ∼−0.85 | ∼−185 |
På vintern går både antalet villabränder och bilolyckor upp — de är korrelerade. Däremot kan man inte säga att villabränder får bilar att krocka. Anledningen är att vintern är en gemensam faktor som orsakar både halare väglag och att fler ljus tänds, vilket leder till fler eldsvådor. Det finns en korrelation mellan villabränder och bilolyckor, men ingen kausalitet.
Anta att det finns en korrelation mellan följande parametrar.
Diskutera om det även finns en kausalitet.
Vi går igenom fallen ett i taget.
Skostorlek och antal länder man besökt
Personer med stor skostorlek har inte nödvändigtvis besökt fler länder. En större skostorlek handlar antagligen snarare om att man är äldre och därmed hunnit med fler utlandsresor. Det råder alltså ingen kausalitet mellan skostorlek och hur många länder man besökt.
Vikt och klädstorlek
Människor som väger mer har generellt en större kropp och behöver därför köpa större klädstorlekar. Det råder alltså kausalitet mellan vikt och klädstorlek.
Temperatur och antal människor på stranden
Det är nog fler som blir badsugna när det är varmt. Det råder alltså kausalitet mellan dagstemperatur och antal människor på stranden.
Mattebetyg och antal engelskglosor man kan
Elever som kan många glosor i engelska är sannolikt ambitiösa och pluggar även mycket matematik. Men enbart kunskaper i engelska gör inte att man blir bättre i matematik. Det råder alltså ingen kausalitet mellan mattebetyg och antalet engelska glosor man kan.
Jafar gör ett arbete om hållbar utveckling och har ritat upp några olika spridningsdiagram.
Han får låna ett program på sin mammas jobbdator för att ta fram tre olika korrelationskoefficienter.
Vi tittar på korrelationskoefficienterna en i taget.
En positiv korrelationskoefficient nära 1 innebär positiv lutning, där trenden är mycket tydlig. Datapunkterna i diagram E ligger lite för utspritt för att ha en så stark korrelationskoefficient. Det diagram som passar bäst in på den beskrivningen är därför C.
Även denna beskriver en stark korrelation, eftersom den är nära -1. Men här ska vi istället leta efter en trend med en negativ lutning. A är inte tillräckligt stark, så korrelationskoefficienten måste höra ihop med diagram F.
Här får Jafar problem. En koefficient så nära 0 innebär mycket svag korrelation. Det är alltså inte osannolikt att det är diagram B. Men i diagram D verkar punkterna ligga nästan på en horisontell linje, vilket även det tyder på att korrelation saknas. Det går inte att avgöra vilken av dem det är, så Jafar får åka tillbaka till sin mammas jobb.
B, C, D, och F kan representeras av korrelationskoefficienterna.
Thorvald har gjort ett spridningsdiagram för två faktorer, x och y.
Om två händelser är korrelerade betyder att om man känner till den ena kan man säga något om den andra. Lär man sig något om en variabel ska det samtidigt ge information om den andra variabeln. Låt säga att y är antalet ben på en spindel och x är spindelns ålder. Då kommer de flesta y-värden vara 8, med väldigt liten spridning.
Om man hittar en spindel med åtta ben kan man inte säga något om dess ålder eftersom antalet ben nästan alltid är 8. Därför är x och y inte korrelerade, så Björn har rätt.