Regression: Lär dig anpassa linjer

Undersök vilken sorts funktion som kan vara lämplig att anpassa till följande datapunkter och gör sedan anpassningen.

$x$	$4$	$7, 3$	$17$	$16$	$10, 4$	$13, 1$	$4, 7$	$8, 2$	$14, 1$
$y$	$- 5$	$7, 8$	$- 5$	$- 0, 2$	$11, 9$	$9, 2$	$- 1, 6$	$9, 8$	$6, 7$

Avrunda konstanterna till en decimal.

Det är svårt att avgöra vilken sorts funktion som stämmer bäst in på punkterna endast genom att titta på x- och y-värdena. För att lättare se vilken typ av funktion de bildar börjar vi med att markera dem i ett spridningsdiagram. Det kan vi göra för hand, men det är enklare att bara mata in dem i miniräknaren. Vi börjar med att sätta in punkterna i listor.

Ritar vi ut dessa får man följande spridningsdiagram.

Nu är det lättare att se hur punkterna först stiger för att sedan sjunka. De bildar alltså en parabel, vilket är formen som en andragradsgraf antar. Det låter då troligt att den funktion som kommer att passa bäst till dem är en andragradsfunktion. Vi anpassar en sådan genom att trycka på knappen STAT på miniräknaren, välja menyn CALC och sedan alternativet QuadReg i listan.

Detta ger följande resultat.

Vi avrundar koefficienterna till en decimal, vilket ger den anpassade funktionen y ≈ - 0,4x^2 + 8,4x - 32,0. Vi kan till slut bekräfta att funktionen stämmer väl överens med punkterna genom att även rita in funktionen i spridningsdiagrammet.

Lina ska skapa en modell som uppskattar hur mycket nyfödda flickor väger under första halvåret. Hon får lite statistik från en stressad sköterska på ett sjukhus som precis vägt sju bebisar i olika åldrar.

Månader	$0$	$1$	$2$	$3$	$4$	$5$	$6$
Gram	$3181$	$3578$	$7985$	$4797$	$5321$	$6127$	$6832$

Anpassa en linjär funktion till datan. Avrunda konstanterna till heltal.

Lina är inte riktigt nöjd med modellen. Hjälp henne att anpassa en ny funktion som ger en bättre uppskattning av flickors vikt under första halvåret. Avrunda konstanterna till heltal.

Vi börjar med att spara datapunkterna i listor. På räknaren trycker vi alltså på knappen STAT och därefter väljer vi Edit...

Vi sätter in x- och y-värdena separat. Eftersom vikten är beroende av tiden är x antalet månader och y är vikten i gram. Observera att listorna nedan innehåller sju värden men endast de fem sista syns, dvs. från 2-6.

Vi använder dessa listor i funktionen LinReg för att anpassa en linjär funktion till punkterna. Tryck igen på STAT, därefter CALC och välj sedan LinReg.

När vi valt LinReg trycker vi på ENTER och får då ut både lutning och skärningspunkt med y-axeln.

Funktionen är alltså y≈ 478x+3 969.

Om vi tittar på grafen ser vi att punkten i x=2 avviker ganska mycket. Det är ganska osannolikt att ett barn på två månader väger cirka 8 kg, så detta är antagligen ett mätfel. Vi plockar därför bort den och gör en ny anpassning.

Den nya funktionen är y≈ 611x+3 037.

Ett experiment har genomförts för att mäta reaktionssträckan vid inbromsningen av en bil, alltså den sträcka bilen färdas innan föraren hinner reagera och börja bromsa, och hur den beror av bilens hastighet. Testerna finns införda i nedanstående koordinatsystem, där avståndet $s$ anger reaktionssträckan i antal meter och hastigheten $v$ anges i km/h.

Anpassa en linjär funktion

s (v)

som beskriver reaktionssträckan vid olika hastigheter. Avrunda konstanterna till två decimaler.

Tolka

s (40) .

Avrunda till närmaste heltal.

Finns det några fel i din modell?

Om man uppmäter reaktionssträckan till

40

m när en bil bromsar, hur snabbt körde den? Avrunda till närmaste heltal.

Vi väljer att anpassa en linje med hjälp av miniräknare, men det hade också gått att göra det med ögonmått. Gör vi det med miniräknare måste vi först bestämma punkternas koordinater. Vi läser av v- och s-koordinaten i varje punkt.

Nu vet vi v- och s-värdet i varje punkt och vi sätter dem i listor på miniräknaren. Då trycker vi först på STAT och välj därefter Edit...

Efter att vi har fört in värdena trycker vi på STAT igen, väljer CALC och därefter LinReg i listan, för att göra en linjär regression som anpassar en rät linje till punkterna.

Vår anpassade funktion är alltså s≈ 0.27v+0.93

Vi vill beräkna s(40), vilket kan tolkas som reaktionssträckan när man kör i 40 km/h. Vi sätter in v = 40 i funktionen från förra uppgiften, vilket ger

Bilen hinner alltså färdas 12 meter innan man hinner reagera om man kör i 40 km/h.

Enligt modellen är reaktionssträckan ca 1 meter när hastigheten är 0 km/h. En bil som står stilla kommer ju inte att röra sig framåt alls, oavsett hur lång tid föraren tar på sig att reagera, så där måste modellen ha fel. En korrekt modell borde gå igenom origo.

Vi söker den hastighet som ger en reaktionssträcka på 40 m. Den kan vi hitta genom att sätta s = 40 i vår funktion och lösa ut v.

Bilen färdades alltså i ungefär 145 km/h.

Johan och Magnus ska undersöka hur populationstillväxten för en utrotningshotad fågelart ser ut i framtiden. Till sin hjälp har de information om hur stor populationen har varit under ett antal år. Det gav nedanstående spridningsdiagram, där varje steg på $x -$ axeln anger ett år efter att mätningarna började och de på $y -$ axeln anger antalet djur i tusental.

Graf som beskriver hur en population växer över tid

Johan menar att tillväxten är linjär medan Magnus, som har studerat hur populationer växer, säger att en exponentiell modell är att föredra. De gör två olika regressioner och får följande resultat.

Johans resultat från regressionsanalysen

Magnus resultat från regressionsanalysen

Tolka

a

i Johans modell.

Tolka

b

i Magnus modell.

För att se hur väl deras funktioner passar in på datapunkterna ritar Johan och Magnus ut dem i spridningsdiagrammet.

Två spridningsdiagram med anpassade linjära och exponentiella funktioner

Johan påstår att det inte spelar någon roll vilken modell man väljer eftersom skillnaden är så liten. Magnus påpekar att eftersom modellen ska användas för att uppskatta framtida populationer bör man även titta på större värden än de som finns utritade. Med hur många fåglar skiljer sig modellerna åt efter

10

år? Avrunda till närmaste hundratal.

Med hur många fåglar skiljer sig modellerna åt efter

50

år? Avrunda till närmaste tusental.

Vi börjar med att titta på Johans modell, med konstanterna avrundade till två decimaler: y = 0,41x + 1,78. I modellen ska vi tolka värdet 0,41, vilket är riktningskoefficienten för en rät linje. Eftersom variabeln x är antalet år och y är antalet fåglar, mätt i tusental, betyder 0,41 att 0,41 * 1000 = 410 fåglar läggs till populationen varje år.

Vi tittar sedan på Magnus modell: y = 2,00 * 1,13^x. I denna exponentialfunktion ska vi undersöka värdet 1,13, vilket är en förändringsfaktor. Det betyder att populationen ökar med 13 % varje år.

Vi vill jämföra hur modellerna skiljer sig åt efter 10 år. Vi sätter därför in x = 10 i båda modellerna: Johan:& 0,41* 10 + 1,78 = 5,88 ≈ 5,9 [0.5em] Magnus:& 2,00* 1,13^(10) = 6,78913... ≈ 6,8. Johans modell säger alltså att det finns 5 900 fåglar efter 10 år medan Magnus modell ger att den är lite större med 6 800 fåglar. Modellerna skiljer sig då med 6 800 - 5 900 = 900 fåglar.

Vi vill nu jämföra hur modellerna skiljer sig åt efter 50 år. Johan:& 0,41* 50 + 1,78 = 22,28 ≈ 22 [0.5em] Magnus:& 2,00* 1,13^(50) = 901,47185 ... ≈ 901. Nu blev det en stor skillnad. Johans modell uppskattar populationen till bara 22 000 fåglar medan med Magnus modell får man 901 000. Skillnaden är 901 000 - 22 000 = 879 000, alltså nästan en miljon fåglar. Det verkar som att skillnaden mellan modellerna blir större ju längre bort från starttiden man går.

I figuren ovan har vi visualiserat detta genom att rita ut modellernas funktioner upp till 30 år, med femårsintervall på x-axeln och tiotusental på y-axeln. De två modellerna verkar alltså stämma någorlunda bra överens i början men skiljer sig mer och mer åt ju längre bort från startpunkten man kommer.

Dylan sparar pengar för att köpa en gitarr som kostar $2300$ kr. Varje vecka skriver han ner hur mycket pengar han har samlat ihop.

Vecka	$1$	$2$	$3$	$4$	$5$
Summa	$523$	$619$	$752$	$861$	$999$

Uppskatta hur lång tid det kommer att ta innan han har råd att köpa gitarren. Avrunda till heltal.

Om vi ska förutsäga hur Dylans pengar kommer att öka anpassar vi en funktion till de datapunkter vi känner till. Vi börjar med att göra ett spridningsdiagram för att se vilken trend de följer.

Baserat på detta ser ökningen linjär ut. Vi för då in datapunkterna i miniräknaren och väljer LinReg för att anpassa en rät linje till dem, vilket ger följande resultat.

Den anpassade funktionen är alltså y = 119,4x + 392,2, där y är summan pengar och x är antalet veckor. Om vi ritar in funktionen i spridningsdiagrammet ser vi att den passar mycket väl in med datapunkterna.

Vi kan nu använda vår anpassade funktion för att uppskatta tiden det tar att komma upp i 2 300 kr, alltså kostnaden för gitarren. Vi sätter y = 2 300 och löser ut x.

Om Dylan fortsätter spara i samma takt tar det ungefär 16 veckor innan han har råd med gitarren.

Antalet bakterier i en cellodling av E-coli ökar exponentiellt. Tabellen nedan visar hur många bakterier som fanns i odlingen vid olika tidpunkter.

Tid (min)	$0$	$20$	$40$	$60$	$80$
Antal bakterier	$6$	$14$	$25$	$51$	$98$

Uppskatta hur lång tid det tar innan det finns en miljard bakterier i odlingen om de får möjligheten att fortsätta tillväxa på samma sätt. Svara i hela timmar.

Med de kända värdena kan vi genom regression på räknaren anpassa en exponentialfunktion, där vi låter y vara antalet bakterier efter t minuter. Därefter kan vi använda modellen för att förutsäga hur lång tid det tar för bakterierna att bli en miljard stycken.

Anpassning av funktion

Vi börjar med att skriva in våra värden i listor på räknaren. Tryck på STAT och sedan Edit... för att komma till listorna. Skriv in ena radens värden i lista L1 och andra radens värden i lista L2.

När värdena är inmatade trycker vi på STAT igen och väljer då CALC-menyn. Där klickar vi oss ner till ExpReg och trycker på ENTER.

Vi får då reda på det C- och a-värde som är specifikt för denna exponentialfunktion. Observera dock att miniräknaren kallar C-värdet för a och a-värdet för b.

Vi tar med ganska många decimaler, här fyra stycken, när vi anger funktionens C- och a-värden. Vi får då ett mer korrekt resultat när vi i nästa deluppgift använder funktionen i vidare beräkning. Funktionen blir då y=6,4074* 1,0350^t.

Beräkning av tiden

Vi ska beräkna hur lång tid det tar innan antalet bakterier är en miljard, dvs. vi vill bestämma t då y=10^9. Det ger oss en ekvation som vi exempelvis kan lösa med tiologaritmer.

Det tar alltså ungefär 548 minuter innan det blir en miljard bakterier, vilket är detsamma som 548/60 ≈ 9 timmar.

Regression

Förkunskaper

Regression

Spridningsdiagram

Linjär regression

Anpassa en rät linje med ögonmått

Svar

Ledtråd

Lösning

Icke-linjär regression

Regression på räknare

Passar linjen?

Anpassning av funktion

Beräkning av tiden

Regression

Rekommenderade uppgifter

	8 sidor teori
	19 Uppgifter - Nivå 1 - 3
	Varje lektion är menad motsvara 1-2 lektioner i klassrummet.