Logga in
Regression inom matematiken refererar till processen att anpassa matematiska funktioner till mätdata. Det används för att skapa modeller av verkliga processer. Innehållet förklarar olika typer av regression, såsom linjär och icke-linjär regression, och hur de kan tillämpas med olika metoder som minsta kvadratmetoden. Linjär regression anpassar en rak linje till kända datapunkter, medan icke-linjär regression kan involvera kvadratiska eller exponentiella funktioner. Lektionen inkluderar också exempel och instruktioner om hur man utför regression med hjälp av räknare, anpassar funktioner till datapunkter och visualiserar data genom spridningsdiagram.
| | 8 sidor teori |
| | 19 Uppgifter - Nivå 1 - 3 |
| | Varje lektion är menad motsvara 1-2 lektioner i klassrummet. |
I den här lektionen går vi igenom följande begrepp:
Regression innebär att man anpassar matematiska funktioner till mätdata. Det används bland annat för att skapa modeller av verkliga förlopp. Olika sorters regressioner används beroende på vilka samband som finns, t.ex. linjär regression och icke-linjär regression.
Ett spridningsdiagram är ett sätt att visualisera mätdata med två parametrar i ett koordinatsystem. Om man t.ex. mäter höjden på tomatplantor vid olika tidpunkter får man ett antal datapunkter som kan markeras i ett koordinatsystem med tiden som x-koordinat och höjden som y-koordinat. Då har man gjort ett spridningsdiagram.
Linjär regression är den form av regression som används när man anpassar en rät linje till kända datapunkter. Detta kan antingen göras för hand, med hjälp av en linjal och ögonmått, eller med hjälp av räknare. Räknaren använder matematiska metoder som den s.k. minsta kvadratmetoden. Nedan har linjär regression använts för att anpassa en rät linje till ett antal datapunkter.
Exempel ekvation: y = 0,5x + 1.
Linjen skär y-axeln vid 1, vilket innebär att m-värdet för den räta linjen är 1. Vi ser också att linjen stiger med ett steg i y-led för varje två steg i x-led, vilket ger riktningskoefficienten k = Δ y/Δ x = 1/2 = 0,5. Den räta linjen vi har anpassat till datapunkterna har alltså ekvationen y = 0,5x + 1. Beroende på hur man har ritat sin linje är det möjligt att man får en lite annorlunda ekvation än denna, men den kan vara precis lika rätt.
Icke-linjär regression innebär att man anpassar en funktion som inte är linjär. Det kan t.ex. röra sig om andragradsfunktioner eller exponentialfunktioner. Till skillnad från linjär regression kan detta vara svårt att göra för hand och för det mesta används den s.k. minsta kvadratmetoden. Nedan har en andragradskurva anpassats till mätpunkterna.
På de flesta grafritande räknare kan man göra regression, dvs. anpassa funktioner till datapunkter.
När man gör detta visas ett antal kolumner markerade L1, L2, L3 osv.
Med hjälp av piltangenterna kan man markera var i listorna man vill fylla i värden. Punkterna som funktionen ska anpassas till matas in med x-värdena i listan L_1 och motsvarande y-värden i L_2. Skriv in värdena med sifferknapparna följt av ENTER.
Det går att ta bort värden med DEL och det går även att skjuta in värden med INS (2nd + DEL).
Bland annat finns
Genom att pila ned till något alternativ och trycka på ENTER, följt av ENTER igen, utförs den valda regressionen. T.ex. kan man välja linjär regression.
Räknaren skriver ut det generella uttrycket för funktionen och de konstanter som den har anpassat. Här blev den anpassade funktionen y=5,92x-6,72.
Givet ett spridningsdiagram och en linje, avgör om linjen korrekt representerar den linjära regressionen av data.
Undersök vilken sorts funktion som kan vara lämplig att anpassa till följande datapunkter och gör sedan anpassningen.
| x | 4 | 7,3 | 17 | 16 | 10,4 | 13,1 | 4,7 | 8,2 | 14,1 |
|---|---|---|---|---|---|---|---|---|---|
| y | - 5 | 7,8 | - 5 | - 0,2 | 11,9 | 9,2 | - 1,6 | 9,8 | 6,7 |
Avrunda konstanterna till en decimal.
Det är svårt att avgöra vilken sorts funktion som stämmer bäst in på punkterna endast genom att titta på x- och y-värdena. För att lättare se vilken typ av funktion de bildar börjar vi med att markera dem i ett spridningsdiagram. Det kan vi göra för hand, men det är enklare att bara mata in dem i miniräknaren. Vi börjar med att sätta in punkterna i listor.
Ritar vi ut dessa får man följande spridningsdiagram.
Nu är det lättare att se hur punkterna först stiger för att sedan sjunka. De bildar alltså en parabel, vilket är formen som en andragradsgraf antar. Det låter då troligt att den funktion som kommer att passa bäst till dem är en andragradsfunktion. Vi anpassar en sådan genom att trycka på knappen STAT på miniräknaren, välja menyn CALC och sedan alternativet QuadReg i listan.
Detta ger följande resultat.
Vi avrundar koefficienterna till en decimal, vilket ger den anpassade funktionen y ≈ - 0,4x^2 + 8,4x - 32,0. Vi kan till slut bekräfta att funktionen stämmer väl överens med punkterna genom att även rita in funktionen i spridningsdiagrammet.
| Månader | 0 | 1 | 2 | 3 | 4 | 5 | 6 |
|---|---|---|---|---|---|---|---|
| Gram | 3 181 | 3 578 | 7 985 | 4 797 | 5 321 | 6 127 | 6 832 |
Vi börjar med att spara datapunkterna i listor. På räknaren trycker vi alltså på knappen STAT och därefter väljer vi Edit...
Vi sätter in x- och y-värdena separat. Eftersom vikten är beroende av tiden är x antalet månader och y är vikten i gram. Observera att listorna nedan innehåller sju värden men endast de fem sista syns, dvs. från 2-6.
Vi använder dessa listor i funktionen LinReg för att anpassa en linjär funktion till punkterna. Tryck igen på STAT, därefter CALC och välj sedan LinReg.
När vi valt LinReg trycker vi på ENTER och får då ut både lutning och skärningspunkt med y-axeln.
Funktionen är alltså y≈ 478x+3 969.
Om vi tittar på grafen ser vi att punkten i x=2 avviker ganska mycket. Det är ganska osannolikt att ett barn på två månader väger cirka 8 kg, så detta är antagligen ett mätfel. Vi plockar därför bort den och gör en ny anpassning.
Den nya funktionen är y≈ 611x+3 037.
Vi väljer att anpassa en linje med hjälp av miniräknare, men det hade också gått att göra det med ögonmått. Gör vi det med miniräknare måste vi först bestämma punkternas koordinater. Vi läser av v- och s-koordinaten i varje punkt.
Nu vet vi v- och s-värdet i varje punkt och vi sätter dem i listor på miniräknaren. Då trycker vi först på STAT och välj därefter Edit...
Efter att vi har fört in värdena trycker vi på STAT igen, väljer CALC och därefter LinReg i listan, för att göra en linjär regression som anpassar en rät linje till punkterna.
Vår anpassade funktion är alltså s≈ 0,27v+0,93
Vi vill beräkna s(40), vilket kan tolkas som reaktionssträckan när man kör i 40 km/h. Vi sätter in v = 40 i funktionen från förra uppgiften, vilket ger
Bilen hinner alltså färdas 12 meter innan man hinner reagera om man kör i 40 km/h.
Enligt modellen är reaktionssträckan ca 1 meter när hastigheten är 0 km/h. En bil som står stilla kommer ju inte att röra sig framåt alls, oavsett hur lång tid föraren tar på sig att reagera, så där måste modellen ha fel. En korrekt modell borde gå igenom origo.
Vi söker den hastighet som ger en reaktionssträcka på 40 m. Den kan vi hitta genom att sätta s = 40 i vår funktion och lösa ut v.
Bilen färdades alltså i ungefär 145 km/h.
Johan menar att tillväxten är linjär medan Magnus, som har studerat hur populationer växer, säger att en exponentiell modell är att föredra. De gör två olika regressioner och får följande resultat.
Johan påstår att det inte spelar någon roll vilken modell man väljer eftersom skillnaden är så liten. Magnus påpekar att eftersom modellen ska användas för att uppskatta framtida populationer bör man även titta på större värden än de som finns utritade. Med hur många fåglar skiljer sig modellerna åt efter 10 år? Avrunda till närmaste hundratal.
Vi börjar med att titta på Johans modell, med konstanterna avrundade till två decimaler: y = 0,41x + 1,78. I modellen ska vi tolka värdet 0,41, vilket är riktningskoefficienten för en rät linje. Eftersom variabeln x är antalet år och y är antalet fåglar, mätt i tusental, betyder 0,41 att 0,41 * 1000 = 410 fåglar läggs till populationen varje år.
Vi tittar sedan på Magnus modell:
y = 2,00 * 1,13^x.
I denna exponentialfunktion ska vi undersöka värdet 1,13, vilket är en förändringsfaktor. Det betyder att populationen ökar med 13 % varje år.
Vi vill jämföra hur modellerna skiljer sig åt efter 10 år. Vi sätter därför in x = 10 i båda modellerna:
Johan:& 0,41* 10 + 1,78 = 5,88 ≈ 5,9 [0.5em]
Magnus:& 2,00* 1,13^(10) = 6,78913... ≈ 6,8.
Johans modell säger alltså att det finns 5 900 fåglar efter 10 år medan Magnus modell ger att den är lite större med 6 800 fåglar. Modellerna skiljer sig då med 6 800 - 5 900 = 900 fåglar.
Vi vill nu jämföra hur modellerna skiljer sig åt efter 50 år.
Johan:& 0,41* 50 + 1,78 = 22,28 ≈ 22 [0.5em]
Magnus:& 2,00* 1,13^(50) = 901,47185 ... ≈ 901.
Nu blev det en stor skillnad. Johans modell uppskattar populationen till bara 22 000 fåglar medan med Magnus modell får man 901 000. Skillnaden är 901 000 - 22 000 = 879 000, alltså nästan en miljon fåglar. Det verkar som att skillnaden mellan modellerna blir större ju längre bort från starttiden man går.
I figuren ovan har vi visualiserat detta genom att rita ut modellernas funktioner upp till 30 år, med femårsintervall på x-axeln och tiotusental på y-axeln. De två modellerna verkar alltså stämma någorlunda bra överens i början men skiljer sig mer och mer åt ju längre bort från startpunkten man kommer.
Dylan sparar pengar för att köpa en gitarr som kostar 2 300 kr. Varje vecka skriver han ner hur mycket pengar han har samlat ihop.
| Vecka | 1 | 2 | 3 | 4 | 5 |
|---|---|---|---|---|---|
| Summa | 523 | 619 | 752 | 861 | 999 |
Uppskatta hur lång tid det kommer att ta innan han har råd att köpa gitarren. Avrunda till heltal.
Om vi ska förutsäga hur Dylans pengar kommer att öka anpassar vi en funktion till de datapunkter vi känner till. Vi börjar med att göra ett spridningsdiagram för att se vilken trend de följer.
Baserat på detta ser ökningen linjär ut. Vi för då in datapunkterna i miniräknaren och väljer LinReg för att anpassa en rät linje till dem, vilket ger följande resultat.
Den anpassade funktionen är alltså y = 119,4x + 392,2, där y är summan pengar och x är antalet veckor. Om vi ritar in funktionen i spridningsdiagrammet ser vi att den passar mycket väl in med datapunkterna.
Vi kan nu använda vår anpassade funktion för att uppskatta tiden det tar att komma upp i 2 300 kr, alltså kostnaden för gitarren. Vi sätter y = 2 300 och löser ut x.
Om Dylan fortsätter spara i samma takt tar det ungefär 16 veckor innan han har råd med gitarren.
Antalet bakterier i en cellodling av E-coli ökar exponentiellt. Tabellen nedan visar hur många bakterier som fanns i odlingen vid olika tidpunkter.
| Tid (min) | 0 | 20 | 40 | 60 | 80 |
|---|---|---|---|---|---|
| Antal bakterier | 6 | 14 | 25 | 51 | 98 |
Uppskatta hur lång tid det tar innan det finns en miljard bakterier i odlingen om de får möjligheten att fortsätta tillväxa på samma sätt. Svara i hela timmar.
Med de kända värdena kan vi genom regression på räknaren anpassa en exponentialfunktion, där vi låter y vara antalet bakterier efter t minuter. Därefter kan vi använda modellen för att förutsäga hur lång tid det tar för bakterierna att bli en miljard stycken.
Vi börjar med att skriva in våra värden i listor på räknaren. Tryck på STAT och sedan Edit... för att komma till listorna. Skriv in ena radens värden i lista L1 och andra radens värden i lista L2.
När värdena är inmatade trycker vi på STAT igen och väljer då CALC-menyn. Där klickar vi oss ner till ExpReg och trycker på ENTER.
Vi får då reda på det C- och a-värde som är specifikt för denna exponentialfunktion. Observera dock att miniräknaren kallar C-värdet för a och a-värdet för b.
Vi tar med ganska många decimaler, här fyra stycken, när vi anger funktionens C- och a-värden. Vi får då ett mer korrekt resultat när vi i nästa deluppgift använder funktionen i vidare beräkning. Funktionen blir då y=6,4074* 1,0350^t.
Vi ska beräkna hur lång tid det tar innan antalet bakterier är en miljard, dvs. vi vill bestämma t då y=10^9. Det ger oss en ekvation som vi exempelvis kan lösa med tiologaritmer.
Det tar alltså ungefär 548 minuter innan det blir en miljard bakterier, vilket är detsamma som 548/60 ≈ 9 timmar.