Logga in
| 6 sidor teori |
| 14 Uppgifter - Nivå 1 - 3 |
| Varje lektion är menad motsvara 1-2 lektioner i klassrummet. |
Regression innebär att man anpassar matematiska funktioner till mätdata. Det används bland annat för att skapa modeller av verkliga förlopp.
Ett spridningsdiagram är ett sätt att visualisera mätdata med två parametrar i ett koordinatsystem. Om man t.ex. mäter höjden på tomatplantor vid olika tidpunkter får man ett antal datapunkter som kan markeras i ett koordinatsystem med tiden som x-koordinat och höjden som y-koordinat. Då har man gjort ett spridningsdiagram.
Linjär regression är den form av regression som används när man anpassar en rät linje till kända datapunkter. Detta kan antingen göras för hand, med hjälp av en linjal och ögonmått, eller med hjälp av räknare. Räknaren använder matematiska metoder som den s.k. minsta kvadratmetoden. Nedan har linjär regression använts för att anpassa en rät linje till ett antal datapunkter.
Har man inte möjlighet att använda en räknare för att anpassa en rät linje får man göra så gott man kan med ögonmått. Det enklaste sättet är att använda en linjal och testa sig fram tills man hittar en linje som passar så bra som möjligt med så många punkter som möjligt. I det här fallet kan en sådan linje exempelvis se ut på följande sätt.
Icke-linjär regression innebär att man anpassar en funktion som inte är linjär. Det kan t.ex. röra sig om andragradsfunktioner eller exponentialfunktioner. Till skillnad från linjär regression kan detta vara svårt att göra för hand och för det mesta används den s.k. minsta kvadratmetoden. Nedan har en andragradskurva anpassats till mätpunkterna.
När man gör detta visas ett antal kolumner markerade L1, L2, L3 osv.
Med hjälp av piltangenterna kan man markera var i listorna man vill fylla i värden. Punkterna som funktionen ska anpassas till matas in med x-värdena i listan L1 och motsvarande y-värden i L2. Skriv in värdena med sifferknapparna följt av ENTER.
Bland annat finns
Genom att pila ned till något alternativ och trycka på ENTER, följt av ENTER igen, utförs den valda regressionen. T.ex. kan man välja linjär regression.
Undersök vilken sorts funktion som kan vara lämplig att anpassa till följande datapunkter och gör sedan anpassningen.
x | 4 | 7.3 | 17 | 16 | 10.4 | 13.1 | 4.7 | 8.2 | 14.1 |
---|---|---|---|---|---|---|---|---|---|
y | −5 | 7.8 | −5 | −0.2 | 11.9 | 9.2 | −1.6 | 9.8 | 6.7 |
Det är svårt att avgöra vilken sorts funktion som stämmer bäst in på punkterna endast genom att titta på x- och y-värdena. För att lättare se vilken typ av funktion de bildar börjar vi med att markera dem i ett spridningsdiagram. Det kan vi göra för hand, men det är enklare att bara mata in dem i miniräknaren. Vi börjar med att sätta in punkterna i listor.
Ritar vi ut dessa får man följande spridningsdiagram.
Nu är det lättare att se hur punkterna först stiger för att sedan sjunka. De bildar alltså en parabel, vilket är formen som en andragradsgraf antar. Det låter då troligt att den funktion som kommer att passa bäst till dem är en andragradsfunktion. Vi anpassar en sådan genom att trycka på knappen STAT på miniräknaren, välja menyn CALC och sedan alternativet QuadReg i listan.
Detta ger följande resultat.
Vi avrundar koefficienterna till en decimal, vilket ger den anpassade funktionen y ≈ - 0.4x^2 + 8.4x - 32.0. Vi kan till slut bekräfta att funktionen stämmer väl överens med punkterna genom att även rita in funktionen i spridningsdiagrammet.
Lina ska skapa en modell som uppskattar hur mycket nyfödda flickor väger under första halvåret. Hon får lite statistik från en stressad sköterska på ett sjukhus som precis vägt sju bebisar i olika åldrar.
Månader | 0 | 1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|---|---|
Gram | 3181 | 3578 | 7985 | 4797 | 5321 | 6127 | 6832 |
Vi börjar med att spara datapunkterna i listor. På räknaren trycker vi alltså på knappen STAT och därefter väljer vi Edit...
Vi sätter in x- och y-värdena separat. Eftersom vikten är beroende av tiden är x antalet månader och y är vikten i gram. Observera att listorna nedan innehåller sju värden men endast de fem sista syns, dvs. från 2-6.
Vi använder dessa listor i funktionen LinReg för att anpassa en linjär funktion till punkterna. Tryck igen på STAT, därefter CALC och välj sedan LinReg.
När vi valt LinReg trycker vi på ENTER och får då ut både lutning och skärningspunkt med y-axeln.
Funktionen är alltså y≈ 478x+3969.
Om vi tittar på grafen ser vi att punkten i x=2 avviker ganska mycket. Det är ganska osannolikt att ett barn på två månader väger cirka 8 kg, så detta är antagligen ett mätfel. Vi plockar därför bort den och gör en ny anpassning.
Den nya funktionen är y≈ 611x+3037.
Ett experiment har genomförts för att mäta reaktionssträckan vid inbromsningen av en bil, alltså den sträcka bilen färdas innan föraren hinner reagera och börja bromsa, och hur den beror av bilens hastighet. Testerna finns införda i nedanstående koordinatsystem, där avståndet s anger reaktionssträckan i antal meter och hastigheten v anges i km/h.
Vi väljer att anpassa en linje med hjälp av miniräknare, men det hade också gått att göra det med ögonmått. Gör vi det med miniräknare måste vi först bestämma punkternas koordinater. Vi läser av v- och s-koordinaten i varje punkt.
Nu vet vi v- och s-värdet i varje punkt och vi sätter dem i listor på miniräknaren. Då trycker vi först på STAT och välj därefter Edit...
Efter att vi har fört in värdena trycker vi på STAT igen, väljer CALC och därefter LinReg i listan, för att göra en linjär regression som anpassar en rät linje till punkterna.
Vår anpassade funktion är alltså s≈ 0.27v+0.93
Vi vill beräkna s(40), vilket kan tolkas som reaktionssträckan när man kör i 40 km/h. Vi sätter in v = 40 i funktionen från förra uppgiften, vilket ger
Bilen hinner alltså färdas 12 meter innan man hinner reagera om man kör i 40 km/h.
Enligt modellen är reaktionssträckan ca 1 meter när hastigheten är 0 km/h. En bil som står stilla kommer ju inte att röra sig framåt alls, oavsett hur lång tid föraren tar på sig att reagera, så där måste modellen ha fel. En korrekt modell borde gå igenom origo.
Vi söker den hastighet som ger en reaktionssträcka på 40 m. Den kan vi hitta genom att sätta s = 40 i vår funktion och lösa ut v.
Bilen färdades alltså i ungefär 145 km/h.
Johan och Magnus ska undersöka hur populationstillväxten för en utrotningshotad fågelart ser ut i framtiden. Till sin hjälp har de information om hur stor populationen har varit under ett antal år. Det gav nedanstående spridningsdiagram, där varje steg på x-axeln anger ett år efter att mätningarna började och de på y-axeln anger antalet djur i tusental.
Johan menar att tillväxten är linjär medan Magnus, som har studerat hur populationer växer, säger att en exponentiell modell är att föredra. De gör två olika regressioner och får följande resultat.
För att se hur väl deras funktioner passar in på datapunkterna ritar Johan och Magnus ut dem i spridningsdiagrammet.
Vi börjar med att titta på Johans modell, med konstanterna avrundade till två decimaler: y = 0.41x + 1.78. I modellen ska vi tolka värdet 0.41, vilket är riktningskoefficienten för en rät linje. Eftersom variabeln x är antalet år och y är antalet fåglar, mätt i tusental, betyder 0.41 att 0.41 * 1000 = 410 fåglar läggs till populationen varje år.
Vi tittar sedan på Magnus modell:
y = 2.00 * 1.13^x.
I denna exponentialfunktion ska vi undersöka värdet 1.13, vilket är en förändringsfaktor. Det betyder att populationen ökar med 13 % varje år.
Vi vill jämföra hur modellerna skiljer sig åt efter 10 år. Vi sätter därför in x = 10 i båda modellerna:
Johan:& 0.41* 10 + 1.78 = 5.88 ≈ 5.9 [0.5em]
Magnus:& 2.00* 1.13^(10) = 6.78913... ≈ 6.8.
Johans modell säger alltså att det finns 5900 fåglar efter 10 år medan Magnus modell ger att den är lite större med 6800 fåglar. Modellerna skiljer sig då med 6800 - 5900 = 900 fåglar.
Vi vill nu jämföra hur modellerna skiljer sig åt efter 50 år.
Johan:& 0.41* 50 + 1.78 = 22.28 ≈ 22 [0.5em]
Magnus:& 2.00* 1.13^(50) = 901.47185 ... ≈ 901.
Nu blev det en stor skillnad. Johans modell uppskattar populationen till bara 22 000 fåglar medan med Magnus modell får man 901 000. Skillnaden är 901 000 - 22 000 = 879 000, alltså nästan en miljon fåglar. Det verkar som att skillnaden mellan modellerna blir större ju längre bort från starttiden man går.
I figuren ovan har vi visualiserat detta genom att rita ut modellernas funktioner upp till 30 år, med femårsintervall på x-axeln och tiotusental på y-axeln. De två modellerna verkar alltså stämma någorlunda bra överens i början men skiljer sig mer och mer åt ju längre bort från startpunkten man kommer.
Dylan sparar pengar för att köpa en gitarr som kostar 2300 kr. Varje vecka skriver han ner hur mycket pengar han har samlat ihop.
Vecka | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
Summa | 523 | 619 | 752 | 861 | 999 |
Om vi ska förutsäga hur Dylans pengar kommer att öka anpassar vi en funktion till de datapunkter vi känner till. Vi börjar med att göra ett spridningsdiagram för att se vilken trend de följer.
Baserat på detta ser ökningen linjär ut. Vi för då in datapunkterna i miniräknaren och väljer LinReg för att anpassa en rät linje till dem, vilket ger följande resultat.
Den anpassade funktionen är alltså y = 119.4x + 392.2, där y är summan pengar och x är antalet veckor. Om vi ritar in funktionen i spridningsdiagrammet ser vi att den passar mycket väl in med datapunkterna.
Vi kan nu använda vår anpassade funktion för att uppskatta tiden det tar att komma upp i 2 300 kr, alltså kostnaden för gitarren. Vi sätter y = 2300 och löser ut x.
Om Dylan fortsätter spara i samma takt tar det ungefär 16 veckor innan han har råd med gitarren.
Antalet bakterier i en cellodling av E-coli ökar exponentiellt. Tabellen nedan visar hur många bakterier som fanns i odlingen vid olika tidpunkter.
Tid (min) | 0 | 20 | 40 | 60 | 80 |
---|---|---|---|---|---|
Antal bakterier | 6 | 14 | 25 | 51 | 98 |
Med de kända värdena kan vi genom regression på räknaren anpassa en exponentialfunktion, där vi låter y vara antalet bakterier efter t minuter. Därefter kan vi använda modellen för att förutsäga hur lång tid det tar för bakterierna att bli en miljard stycken.
Vi börjar med att skriva in våra värden i listor på räknaren. Tryck på STAT och sedan Edit... för att komma till listorna. Skriv in ena radens värden i lista L1 och andra radens värden i lista L2.
När värdena är inmatade trycker vi på STAT igen och väljer då CALC-menyn. Där klickar vi oss ner till ExpReg och trycker på ENTER.
Vi får då reda på det C- och a-värde som är specifikt för denna exponentialfunktion. Observera dock att miniräknaren kallar C-värdet för a och a-värdet för b.
Vi tar med ganska många decimaler, här fyra stycken, när vi anger funktionens C- och a-värden. Vi får då ett mer korrekt resultat när vi i nästa deluppgift använder funktionen i vidare beräkning. Funktionen blir då y=6.4074* 1.0350^t.
Vi ska beräkna hur lång tid det tar innan antalet bakterier är en miljard, dvs. vi vill bestämma t då y=10^9. Det ger oss en ekvation som vi exempelvis kan lösa med tiologaritmer.
Det tar alltså ungefär 548 minuter innan det blir en miljard bakterier, vilket är detsamma som 548/60 ≈ 9 timmar.