Logga in
| 7 sidor teori |
| 22 Uppgifter - Nivå 1 - 3 |
| Varje lektion är menad motsvara 1-2 lektioner i klassrummet. |
I den här lektionen går vi igenom följande begrepp:
Om det finns ett samband mellan två eller fler faktorer säger man att de korrelerar. Det finns t.ex. en korrelation mellan längd och ålder (fram till att man slutar växa): ju äldre man är, desto längre är man. Detta kallas för positiv korrelation och innebär att om en variabel ökar så ökar även den andra. Om den ena variabeln däremot minskar när den andra ökar kallas det negativ korrelation.
Ju mer datapunkterna ser ut att följa en viss trend, desto mer korrelerade säger man att de är. Om de ligger nästan exakt på en linje säger man att variablerna är starkt korrelerade medan om de är mer utspridda är de svagt korrelerade. För att mäta korrelationen mellan två variabler använder man en korrelationskoefficient.
Korrelationskoefficienten, r, är ett mått på hur stark en korrelation är. Den varierar mellan −1 och 1. Värden nära −1 innebär att korrelationen är stark och negativ, medan en korrelation nära 1 är stark och positiv. Har den värdet 0 finns det ingen korrelation.
I koordinatsystemen visas spridningsdiagram mellan två parametrar.
Se om punkterna bildar ett linjärt mönster. En positiv lutning betyder positiv korrelation, en negativ lutning betyder negativ korrelation, och inget tydligt mönster betyder att korrelationen är nära noll.
Vi tittar på diagrammen ett i taget.
Diagram A visar en positiv korrelation, eftersom lutningen är positiv. Det är även en stark korrelation, eftersom punkterna ligger nära en tänkt rät linje.
Därför är det korrelationskoefficienten r≈1 som passar bäst.
Spridningsdiagram B verkar inte ha någon positiv eller negativ trend.
Därför är korrelationskoefficienten ungefär 0.
Både C och D visar på en negativ korrelation, eftersom det är en negativ lutning. Diagram D har en starkare korrelation än C, eftersom det visar på en tydligare trend.
Därför hör C ihop med r≈−0,85 och D med r≈−1.
Diagram | A | B | C | D |
---|---|---|---|---|
r | ∼1 | ∼0 | ∼−0,85 | ∼−1 |
På vintern går både antalet villabränder och bilolyckor upp — de är korrelerade. Däremot kan man inte säga att villabränder får bilar att krocka. Anledningen är att vintern är en gemensam faktor som orsakar både halare väglag och att fler ljus tänds, vilket leder till fler eldsvådor. Det finns en korrelation mellan villabränder och bilolyckor, men ingen kausalitet.
Anta att det finns en korrelation mellan följande parametrar.
Se lösning.
En stark korrelation betyder inte kausalitet. Kontrollera om en variabel kan påverka den andra, eller om båda är kopplade till en tredje faktor.
Vi går igenom fallen ett i taget.
Personer med stor skostorlek har inte nödvändigtvis besökt fler länder. En större skostorlek handlar antagligen snarare om att man är äldre och därmed hunnit med fler utlandsresor. Det råder alltså ingen kausalitet mellan skostorlek och hur många länder man besökt.
Människor som väger mer har generellt en större kropp och behöver därför köpa större klädstorlekar. Det råder alltså kausalitet mellan vikt och klädstorlek.
Det är nog fler som blir badsugna när det är varmt. Det råder alltså kausalitet mellan dagstemperatur och antal människor på stranden.
Elever som kan många glosor i engelska är sannolikt ambitiösa och pluggar även mycket matematik. Men enbart kunskaper i engelska gör inte att man blir bättre i matematik. Det råder alltså ingen kausalitet mellan mattebetyg och antalet engelska glosor man kan.
Följande applet visar olika spridningsdiagram. Välj den typ av korrelation som stämmer med det visade diagrammet.
Jafar gör ett arbete om hållbar utveckling och har ritat upp några olika spridningsdiagram.
Han får låna ett program på sin mammas jobbdator för att ta fram tre olika korrelationskoefficienter.
Vi tittar på korrelationskoefficienterna en i taget.
En positiv korrelationskoefficient nära 1 innebär positiv lutning, där trenden är mycket tydlig. Datapunkterna i diagram E ligger lite för utspritt för att ha en så stark korrelationskoefficient. Det diagram som passar bäst in på den beskrivningen är därför C.
Även denna beskriver en stark korrelation, eftersom den är nära -1. Men här ska vi istället leta efter en trend med en negativ lutning. A är inte tillräckligt stark, så korrelationskoefficienten måste höra ihop med diagram F.
Här får Jafar problem. En koefficient så nära 0 innebär mycket svag korrelation. Det är alltså inte osannolikt att det är diagram B. Men i diagram D verkar punkterna ligga nästan på en horisontell linje, vilket även det tyder på att korrelation saknas. Det går inte att avgöra vilken av dem det är, så Jafar får åka tillbaka till sin mammas jobb.
B, C, D, och F kan representeras av korrelationskoefficienterna.
Thorvald har gjort ett spridningsdiagram för två faktorer, x och y.
Om två händelser är korrelerade betyder att om man känner till den ena kan man säga något om den andra. Lär man sig något om en variabel ska det samtidigt ge information om den andra variabeln. Låt säga att y är antalet ben på en spindel och x är spindelns ålder. Då kommer de flesta y-värden vara 8, med väldigt liten spridning.
Om man hittar en spindel med åtta ben kan man inte säga något om dess ålder eftersom antalet ben nästan alltid är 8. Därför är x och y inte korrelerade, så Björn har rätt.
När vi använder grafräknare för att hitta en ekvation för den bästa anpassningslinjen, kan vi erhålla korrelationskoefficienten r. Värdet på r beskriver riktningen och styrkan hos ett linjärt förhållande mellan två mått.
Vi kan se att ju närmare värdet på r är 1, desto starkare positiv korrelation har vi. På liknande sätt representerar värden på r som ligger nära -1 en mycket stark negativ korrelation. Med andra ord är korrelationen starkare när det absoluta värdet av dess koefficient r är närmare 1. Svag korrelation: & |r|≈ 0 Stark korrelation: & |r|≈ 1 Vi vill bestämma vilken av de givna korrelationerna som indikerar ett starkare förhållande. -0,98och 0,91 Vi kan se att -0,98 representerar negativ korrelation medan 0,91 beskriver positiv korrelation. För att välja den koefficient som antyder en starkare korrelation, behöver vi jämföra deras absoluta värden. Om de båda var i samma riktning, kunde vi enklare jämföra dem. Låt oss använda de absoluta värdena i detta fall!
Vi kan se att det absoluta värdet av -0,98 är större än det absoluta värdet av 0,91. Därför är -0,98 närmare -1 än 0,91 till 1. Detta betyder att -0,98 indikerar ett starkare förhållande.
Låt oss börja med att komma ihåg när ett förhållande mellan två kvantiteter kan kallas kausalt.
Kausalt förhållande |- En händelse är resultatet av den andra. Med andra ord orsakas förekomsten av en händelse av förekomsten av den andra.
Här får vi veta att försäljningen av solglasögon och badlakan i en butik visar ett positivt linjärt förhållande under en sommar. Positivt linjärt förhållande innebär att när en kvantitet ökar, ökar även den andra. Låt oss ta en titt på ett spridningsdiagram som kan visa detta förhållande.
Förhållandet mellan dessa värden indikerar inte att ökningen av försäljningen av solglasögon orsakar ökningen av försäljningen av badlakan eller omvänt. I det här exemplet kan vi misstänka att sommar och varm temperatur orsakar ökningen av försäljningen av både solglasögon och badlakan.
Kom ihåg att det faktum att två mått är relaterade inte betyder att den ena orsakar den andra. Detta är ett mycket vanligt misstag i resonemang som människor gör.
Anta att vi har ett spridningsdiagram som visar att när värdena på x minskar, minskar även värdena på y. Vi vill bestämma vilken typ av association vi har att göra med. Innan vi gör det, låt oss tänka på två variabler x och y som minskar samtidigt. cc x & y ↓ & ↓ Till exempel, ju yngre ett barn är, desto mindre tid spenderar det vaket under dagen. Låt oss rita ett spridningsdiagram för att illustrera denna situation. Låt x vara ett barns ålder och y vara den tid de spenderar vakna.
Vi ser att när x minskar, så gör även y. Detta beror på att yngre barn behöver mer sömn.
Vi kan se det från ett annat perspektiv — när x ökar, ökar även y. Ju äldre barnet är, desto mindre sömn behöver det.
Eftersom variablerna x och y ökar samtidigt, är associationen mellan dem positiv. Som ett resultat visar spridningsdiagrammet en positiv association.
Vi blir ombedda att avgöra om följande påstående är alltid, ibland eller aldrig sant.
Ett spridningsdiagram som visar ett positivt samband antyder att förhållandet är proportionellt.
För att avgöra detta, låt oss försöka komma på exempel och motexempel till påståendet. Först kommer vi att rita ett spridningsdiagram som visar ett positivt samband där förhållandet mellan variablerna är proportionellt.
Föreställ dig att vi är i en glassbutik. Låt x vara antalet glasskulor vi köper och y deras totala pris.
Intuitivt, ju fler kulor vi köper, desto mer måste vi betala. Det är därför sambandet mellan variablerna är positivt. Här är nu ett spridningsdiagram som visar den totala kostnaden för olika antal kulor.
Vi vet att dessa två variabler är proportionella eftersom varje ny kula kostar lika mycket. Dessutom ligger datapunkterna i linje och bildar en linje.
Nu vill vi komma på ett positivt samband där variablerna inte är proportionella. Detta innebär att båda variablerna kommer att öka samtidigt men grafen för datamängden kommer inte att vara en linje. Låt oss tänka på näckrosor och hur de växer.
Om förutsättningarna är rätt fördubblas antalet näckrosblad i en damm varje dag. Vi kan visa detta i en graf. Låt x representera dagarna och y vara antalet näckrosor i en damm.
Sambandet mellan x och y är positivt eftersom antalet näckrosor växer med tiden. Förhållandet mellan x och y är inte proportionellt eftersom datapunkterna inte bildar en linje.
Låt oss ta en titt på påståendet en gång till.
Ett spridningsdiagram som visar ett positivt samband antyder att förhållandet är proportionellt.
Vi hittade både ett exempel och ett motexempel till påståendet. Det är därför påståendet är ibland sant.