Logga in
| 5 sidor teori |
| 14 Uppgifter - Nivå 1 - 3 |
| Varje lektion är menad motsvara 1-2 lektioner i klassrummet. |
Om det finns ett samband mellan två eller fler faktorer säger man att de korrelerar. Det finns t.ex. en korrelation mellan längd och ålder (fram till att man slutar växa): ju äldre man är, desto längre är man. Detta kallas för positiv korrelation och innebär att om en variabel ökar så ökar även den andra. Om den ena variabeln däremot minskar när den andra ökar kallas det negativ korrelation.
Ju mer datapunkterna ser ut att följa en viss trend, desto mer korrelerade säger man att de är. Om de ligger nästan exakt på en linje säger man att variablerna är starkt korrelerade medan om de är mer utspridda är de svagt korrelerade.
Korrelationskoefficienten, r, är ett mått på hur stark en korrelation är. Den varierar mellan −1 och 1. Värden nära −1 innebär att korrelationen är stark och negativ, medan en korrelation nära 1 är stark och positiv. Har den värdet 0 finns det ingen korrelation.
I koordinatsystemen visas spridningsdiagram mellan två parametrar.
Vi tittar på diagrammen ett i taget.
A
Diagram A visar en positiv korrelation, eftersom lutningen är positiv. Det är även en stark korrelation, eftersom punkterna ligger nära en tänkt rät linje. Därför är det korrelationskoefficienten r≈1 som passar bäst.
B
Spridningsdiagram B verkar inte ha någon positiv eller negativ trend. Därför är korrelationskoefficienten ungefär 0.
C och D
Både C och D visar på en negativ korrelation, eftersom det är en negativ lutning. Diagram D har en starkare korrelation än C, eftersom det visar på en tydligare trend. Därför hör C ihop med r≈−0.85 och D med r≈−1.
Diagram | A | B | C | D |
---|---|---|---|---|
r | ∼185 | ∼085 | ∼−0.85 | ∼−185 |
På vintern går både antalet villabränder och bilolyckor upp — de är korrelerade. Däremot kan man inte säga att villabränder får bilar att krocka. Anledningen är att vintern är en gemensam faktor som orsakar både halare väglag och att fler ljus tänds, vilket leder till fler eldsvådor. Det finns en korrelation mellan villabränder och bilolyckor, men ingen kausalitet.
Anta att det finns en korrelation mellan följande parametrar.
Diskutera om det även finns en kausalitet.
Vi går igenom fallen ett i taget.
Skostorlek och antal länder man besökt
Personer med stor skostorlek har inte nödvändigtvis besökt fler länder. En större skostorlek handlar antagligen snarare om att man är äldre och därmed hunnit med fler utlandsresor. Det råder alltså ingen kausalitet mellan skostorlek och hur många länder man besökt.
Vikt och klädstorlek
Människor som väger mer har generellt en större kropp och behöver därför köpa större klädstorlekar. Det råder alltså kausalitet mellan vikt och klädstorlek.
Temperatur och antal människor på stranden
Det är nog fler som blir badsugna när det är varmt. Det råder alltså kausalitet mellan dagstemperatur och antal människor på stranden.
Mattebetyg och antal engelskglosor man kan
Elever som kan många glosor i engelska är sannolikt ambitiösa och pluggar även mycket matematik. Men enbart kunskaper i engelska gör inte att man blir bättre i matematik. Det råder alltså ingen kausalitet mellan mattebetyg och antalet engelska glosor man kan.
I koordinatsystemen visas sex spridningsdiagram.
Om det finns en tydlig trend bland datapunkterna är korrelationen stark. Det stämmer för diagrammen C och E. Man ser även trender i A, D och F, men de är inte lika tydliga. Därför har de svag korrelation. I diagrammet B kan man inte se någon trend alls, så där finns ingen korrelation.
Korrelationen är positiv om lutningen som spridningsdiagrammet följer är positiv. Det stämmer för A och E. Diagram C, D och F verkar följa en nedåtgående trend, så korrelationen för dem är negativ.
Avgör om det kan finnas någon korrelation mellan variablerna.
Ju fler äpplen du köper, desto dyrare blir det. Priset ökar alltså med vikten, så variablerna är korrelerade. Eftersom priset är en direkt följd av vikten är det även en kausalitet.
Kroppsvikten på vuxna kommer inte att påverka sömnbehovet. Det kan göra det för växande barn, men inte här. Variablerna är alltså inte korrelerade.
Man lever inte längre om man går och köper fler datorer. Men däremot lever man längre i de delar av världen där man har mer pengar till exempelvis rent vatten och mediciner. Därför är det mycket troligt att det finns korrelation mellan variablerna. Dock finns det ingen kausalitet mellan dem, utan korrelationen beror på en tredje variabel: ekonomi.
Anta att följande variabler är korrelerade. Avgör om korrelationen är positiv eller negativ, samt om det råder kausalitet eller inte.
Ju äldre björken blir, desto större kommer diametern att bli. Ökar åldern ökar även diametern, vilket innebär att det är en positiv korrelation. Eftersom diameterns ökningen är en direkt följd av åldern råder även kausalitet.
Antalet telefonkiosker har sjunkit medan antalet skickade SMS har ökat, så det finns en negativ korrelation mellan de två variablerna. Det är dock inte bristen på telefonkiosker som har gjort att fler SMS har skickats, det är snarare den ökande mängden mobiltelefoner som gör att fler människor skickar SMS och färre använder telefonkiosker. Det finns alltså inte någon kausalitet mellan variablerna.
Det finns ett direkt samband mellan temperatur och isbildning. Därmed råder kausalitet mellan variablerna. Då temperaturen sjunker (blir lägre), kommer antalet sjöar som fryser att öka. Därför blir lutningen negativ, och vi får alltså en negativ korrelation.
I Tjorvens kiosk mätte man under en sommarvecka hur maxtemperaturen under dagen påverkade försäljningen av några olika vanliga varor.
Maxtemp | Glass | Korv | Kaffe |
---|---|---|---|
13∘C | 15 | 27 | 67 |
16∘C | 17 | 25 | 66 |
25∘C | 30 | 32 | 40 |
33∘C | 68 | 17 | 11 |
30∘C | 57 | 8 | 15 |
27∘C | 45 | 41 | 23 |
20∘C | 20 | 40 | 64 |
Avgör om det finns någon korrelation mellan maxtemperaturen och antal sålda
Vi ritar ett spridningsdiagram genom att markera punkterna vi får ur tabellens två första kolumner, antingen genom att rita ett koordinatsystem för hand och pricka in punkterna eller genom att skriva in värdena i listor på räknaren. Vi sätter temperatur på x-axeln och antal glassar på y-axeln, så vi får punkterna (13,15), (16,17) osv.
Vi ser det verkar finnas en positiv korrelation mellan punkterna. Folk köper alltså mer glass ju varmare dagen är.
Vi gör på samma sätt med temperatur och korv.
Det verkar inte finnas någon korrelation mellan temperatur och antal sålda korvar. Folks korvvanor påverkas inte av om det är kallt eller varmt.
Slutligen gör vi på samma sätt med kaffekopparna.
Det verkar finnas en svag negativ korrelation mellan temperatur och hur mycket kaffe folk köper.
Går det att avgöra om det finns korrelation mellan variablerna? Motivera.
För att det ska finnas korrelation måste vi kunna se ett statistiskt samband mellan variablerna, dvs. de måste gå att mäta. Inkomst går att mäta i t.ex. kronor, men det finns inget mått på lycka eftersom det tolkas på olika sätt för olika människor. Vi kan därför inte avgöra om det finns korrelation eller ej.
Även här går det inte att mäta den ena variabeln, färg. Därför går det inte att avgöra om det finns någon korrelation.
På samma sätt som i tidigare deluppgifter är den ena variabeln, längd, mätbar men inte skönhet. Olika människor uppfattar skönhet på olika sätt, och därför kan vi inte avgöra om det finns korrelation mellan längd och skönhet.