Logga in
| 8 sidor teori |
| 19 Uppgifter - Nivå 1 - 3 |
| Varje lektion är menad motsvara 1-2 lektioner i klassrummet. |
I den här lektionen går vi igenom följande begrepp:
Regression innebär att man anpassar matematiska funktioner till mätdata. Det används bland annat för att skapa modeller av verkliga förlopp. Olika sorters regressioner används beroende på vilka samband som finns, t.ex. linjär regression och icke-linjär regression.
Ett spridningsdiagram är ett sätt att visualisera mätdata med två parametrar i ett koordinatsystem. Om man t.ex. mäter höjden på tomatplantor vid olika tidpunkter får man ett antal datapunkter som kan markeras i ett koordinatsystem med tiden som x-koordinat och höjden som y-koordinat. Då har man gjort ett spridningsdiagram.
Linjär regression är den form av regression som används när man anpassar en rät linje till kända datapunkter. Detta kan antingen göras för hand, med hjälp av en linjal och ögonmått, eller med hjälp av räknare. Räknaren använder matematiska metoder som den s.k. minsta kvadratmetoden. Nedan har linjär regression använts för att anpassa en rät linje till ett antal datapunkter.
Exempel linje:
Exempel ekvation: y=0,5x+1.
Linjen måste inte nödvändigtvis gå genom punkterna.
Har man inte möjlighet att använda en räknare för att anpassa en rät linje får man göra så gott man kan med ögonmått. Det enklaste sättet är att använda en linjal och testa sig fram tills man hittar en linje som passar så bra som möjligt med så många punkter som möjligt. I det här fallet kan en sådan linje exempelvis se ut på följande sätt.
Icke-linjär regression innebär att man anpassar en funktion som inte är linjär. Det kan t.ex. röra sig om andragradsfunktioner eller exponentialfunktioner. Till skillnad från linjär regression kan detta vara svårt att göra för hand och för det mesta används den s.k. minsta kvadratmetoden. Nedan har en andragradskurva anpassats till mätpunkterna.
Skriv in värden Det första steget är att skriva in datapunkterna i räknaren. På en TI-räknare görs detta genom att först trycka på knappen STAT och sedan välja alternativet Edit genom att markera det och trycka på knappen ENTER.
När man gör detta visas ett antal kolumner markerade L1, L2, L3 osv.
Med hjälp av piltangenterna kan man markera var i listorna man vill fylla i värden. Punkterna som funktionen ska anpassas till matas in med x-värdena i listan L1 och motsvarande y-värden i L2. Skriv in värdena med sifferknapparna följt av ENTER.
Det går att ta bort värden med DEL och det går även att skjuta in värden med INS (2nd + DEL).
När värdena är införda kan regressionen utföras genom att igen trycka på knappen STAT, följt av piltangenten åt höger för att välja menyalternativet CALC. I denna meny listas de olika regressioner som finns tillgängliga.
Bland annat finns
Genom att pila ned till något alternativ och trycka på ENTER, följt av ENTER igen, utförs den valda regressionen. T.ex. kan man välja linjär regression.
Räknaren skriver ut det generella uttrycket för funktionen och de konstanter som den har anpassat. Här blev den anpassade funktionen y=5,92x−6,72.
Givet ett spridningsdiagram och en linje, avgör om linjen korrekt representerar den linjära regressionen av data.
Anpassa en linjär funktion till datapunkterna i nedanstående koordinatsystem.
Vi kan anpassa en rät linje till punkterna i spridningsdiagrammet antingen med hjälp av en miniräknare eller för hand. Vi väljer att göra det med miniräknare eftersom det ger ett mer exakt resultat, och för att göra det måste vi först veta vilka punkterna vi ska anpassa linjen till. Vi börjar då med att läsa av punkternas koordinater.
Nu för vi in dessa punkter i två separata listor på miniräknaren. Vi trycker på knappen STAT och väljer sedan Edit... där vi matar in de sex x-värdena i listan L1 och y-värdena i listan L2.
När vi matat in listorna kan vi göra en linjär regression som anpassar en rät linje av formen y = kx + m till punkterna. Vi trycker på STAT igen och väljer sedan menyn Calc följt av alternativet LinReg.
När vi valt LinReg trycker vi på ENTER och får då ut k-värdet, som här heter a, och m-värdet som kallas b.
Med avrundade värden är funktionen alltså y≈ 1,14x-0,33. För att bekräfta att vi faktiskt har fått något som passar in på punkterna ritar vi ut funktionen i spridningsdiagrammet.
Magda ska anpassa funktioner till datapunkterna i ett antal spridningsdiagram. Avgör vilka hon bör anpassa linjära funktioner, andragradsfunktioner och exponentiella funktioner till.
Datapunkterna i spridningsdiagrammet ser ut att först gå ner för att sedan gå upp igen. Det är en parabel, vilket är formen på en andragradsfunktion. Magda ska alltså anpassa en andragradsfunktion till punkterna.
För det här spridningsdiagrammet ser punkterna ut att ungefär ligga på en rät linje. Magda bör alltså anpassa en linjär funktion.
I det här fallet ser punkterna ut att följa antingen en exponentialkurva eller en bit av en andragradskurva. Exponentialkurvan ser ut att passa bra.
Om man testar andragradskurvan ser den inte ut att följa punkterna lika väl.
Men för att inse detta behöver hon alltså testa att anpassa både en exponentialfunktion och en andragradsfunktion.
Anpassa en andragradsfunktion till nedanstående data.
x | 0 | 3 | 6 | 9 | 12 |
---|---|---|---|---|---|
y | 146 | 192 | 149 | 53 | −135 |
Vi börjar med att spara datapunkterna i listor. På räknaren trycker vi på knappen STAT och väljer därefter Edit i listan.
Vi sätter in x- och y-värden separat.
Nu kan dessa listor användas i funktionen QuadReg för att anpassa en andragradsfunktion till punkterna. Tryck igen på STAT, därefter CALC och sedan QuadReg.
När vi valt på QuadReg trycker vi på ENTER och får då ut koefficienter framför x^2 och x samt konstant.
Funktionen är alltså y≈ - 4,135x^2+26,25x+146,7.
Använd din räknare för att anpassa en linjär funktion till följande värden. Avrunda konstanterna till två decimaler.
x | 1 | 2 | 4 | 6 | 8 |
---|---|---|---|---|---|
y | 3 | 3,75 | 6,5 | 7,5 | 9 |
Använd din räknare för att anpassa en andragradsfunktion till följande värden. Avrunda konstanterna till två decimaler.
x | 2 | 5 | 7 | 9 | 10 |
---|---|---|---|---|---|
y | 3,9 | 28 | 47 | 80 | 110 |
Hur man gör på räknaren för att anpassa funktioner är olika beroende på vilken modell man använder. På vår räknare (TI-82 Stat) måste man först spara punkterna man fått i listor genom att trycka på knappen STAT och därefter välja Edit i listan.
Vi går in där och matar in x- och y-värden separat.
Nu kan dessa listor användas för att anpassa en linjär (dvs. förstagrads-) funktion till punkterna. Tryck igen på STAT, bläddra till CALC och välj därefter LinReg.
När vi valt LinReg trycker vi på ENTER och får då ut k-värdet, som här heter a, och m-värdet som kallas b.
Funktionen är alltså y≈ 0,87x+2,30. Vi visar även här hur anpassningen ser ut grafiskt.
Vi gör samma sak igen, dvs. matar in våra värden i två listor men istället för att välja LinReg så väljer vi att anpassa en andragradsfunktion, dvs. QuadReg.
När vi valt LinReg trycker vi på ENTER och får då ut konstanterna a, b och c.
Andragradsfunktionen är y ≈ 1,29x^2-2,80x+5,64. Grafiskt ser anpassningen ut som i figuren.
Tabellen visar världsrekordet för 200 meter fjärilssim för några olika årtal.
År | 1960 | 1970 | 1980 | 1990 | 2000 | 2010 |
---|---|---|---|---|---|---|
Tid (s) | 133,2 | 125,7 | 118,3 | 115,2 | 114,7 | 112,8 |
För att anpassa en exponentialfunktion behöver vi använda en räknare. Vi låter år 1960 representera x=0 och y världsrekordtiden i sekunder.
x | 0 | 10 | 20 | 30 | 40 | 50 |
---|---|---|---|---|---|---|
y | 133,2 | 125,7 | 118,3 | 115,2 | 114,7 | 112,8 |
Vi trycker på knappenSTAT och väljer sedan Edit... där vi matar in x- respektive y-värdena i två listor.
När vi matat in listorna kan vi göra en exponentiell regression som anpassar en funktion på formen y = C* a^x till punkterna. Vi trycker på STAT igen och väljer sedan menyn CALC följt av alternativet ExpReg.
När vi valt ExpReg trycker vi på ENTER och får då ut C-värdet, som här heter a, och a-värdet som kallas b.
Avrundar vi våra värden för C och a får vi funktionen y = 129,9* 0,9968^x.
Det finns troligen en gräns för hur snabbt människan kan simma, förutsatt att grenen fjärilssim kommer att se ut på samma sätt framöver. Vi undersöker vad som händer om x blir mycket stort, tex 1 000.
Enligt modellen simmar en människa 200 meter fjärilssim på 5 sekunder tusen år efter x=0, dvs. år 2960. Det verkar orealistiskt. Därför kan vi inte förvänta oss att modellen gäller hur länge som helst, vilket är en begränsning.
Hitta en ekvation för den bästa anpassningen av linjen för datan nedan. Identifiera och tolka korrelationskoefficienten.
Dagar Träning, x | Tävlingstid (minuter), y |
---|---|
2 | 25,45 |
14 | 22,30 |
7 | 23,85 |
5 | 24,10 |
21 | 20,90 |
18 | 21,20 |
Grafräknare använder linjär regression för att hitta en bäst anpassad linje. Räknare ger också korrelationskoefficienten r. Värdet på r varierar från - 1 till 1, vilket indikerar hur stark korrelationen är och om det är en positiv eller negativ korrelation.
Värde på r | Typ av korrelation |
---|---|
Nära - 1 | Stark negativ korrelation |
Nära 1 | Stark positiv korrelation |
Nära 0 | Ingen korrelation |
Låt oss börja med att betrakta den givna datan.
Träningsdagar, x | Tävlingstid (minuter), y |
---|---|
2 | 25,45 |
14 | 22,30 |
7 | 23,85 |
5 | 24,10 |
21 | 20,90 |
18 | 21,20 |
Vi kommer att använda en räknare för att hitta ekvationen för den bäst anpassade linjen för datapunkterna. Vårt första steg är att mata in datan från tabellen i vår räknare. Vi gör detta genom att trycka på knappen STAT följt av ENTER. Mata in x-värdena i den första listan och y-värdena i den andra listan.
Därefter trycker vi på STAT igen, går till menyn CALC och trycker på 4, vilket motsvarar linjär regression.
Sedan scrollar vi ner och trycker på ENTER på alternativet Beräkna.
Genom att göra detta får vi lutningen och y-skärningen för den bäst anpassade linjen, samt korrelationskoefficienten.
Vi kan se att linjens lutning är ungefär - 0,23 och dess y-skärning är ungefär 25,57. Med denna information kan vi skriva ekvationen för den bäst anpassade linjen i lutningskärningsform. y= - 0,23x+ 25,57 Slutligen ser vi också att korrelationskoefficienten är ungefär - 0,991. Detta innebär att förhållandet mellan antalet träningsdagar och tävlingstiden är en stark negativ korrelation — ekvationen modellerar datan noggrant.
För att få korrelationskoefficienten med vår räknare måste vi först se till att vi har aktiverat rätt inställningar. För att göra det trycker vi på 2ND följt av . Sedan scrollar vi ner till DiagnosticOn
och trycker på ENTER.
Nu är vi redo!
Gör ett spridningsdiagram av datan. Identifiera eventuella avvikare, luckor eller kluster.
Studietid (min), x | 30 | 20 | 80 | 90 | 45 | 10 | 30 | 75 | 120 | 80 |
---|---|---|---|---|---|---|---|---|---|---|
Testresultat, y | 80 | 74 | 95 | 97 | 85 | 62 | 83 | 90 | 70 | 91 |
Ett spridningsdiagram är en graf som visar förhållandet mellan två datamängder. Låt oss betrakta den givna tabellen.
Studietid (min), x | 30 | 20 | 80 | 90 | 45 | 10 | 30 | 75 | 120 | 80 |
---|---|---|---|---|---|---|---|---|---|---|
Testresultat, y | 80 | 74 | 95 | 97 | 85 | 62 | 83 | 90 | 70 | 91 |
Nu kommer vi att rita båda datamängderna som ordnade par i ett koordinatsystem.
Låt oss sedan komma ihåg några viktiga definitioner.
Uteliggare | Kluster | Gap |
---|---|---|
En uteliggare är en datapunkt som skiljer sig från de andra datapunkterna. | Ett kluster är en grupp punkter som ligger nära varandra. | Ett gap är ett område i grafen som inte innehåller några data. |
Med dessa definitioner i åtanke kan vi äntligen dra några slutsatser om uteliggarna, klustren och gapen i vår graf.
Representera datan på ett koordinatsystem.
Genomsnittligt pris (kronor), x | 22 | 40 | 28 | 35 | 46 |
---|---|---|---|---|---|
Antal sålda, y | 152 | 94 | 134 | 110 | 81 |
Låt oss betrakta den givna tabellen.
Medelpris (kronor), x | 22 | 40 | 28 | 35 | 46 |
---|---|---|---|---|---|
Antal sålda, y | 152 | 94 | 134 | 110 | 81 |
Nu ska vi rita båda datamängderna som ordnade par i ett koordinatsystem.