Logga in
| 6 sidor teori |
| 11 Uppgifter - Nivå 1 - 3 |
| Varje lektion är menad motsvara 1-2 lektioner i klassrummet. |
En av de vanligaste sannolikhetsfördelningarna är normalfördelningen, som kan användas för att beskriva många egenskaper i naturen. Till exempel är längder och vikter ofta normalfördelade. Fördelningen är centrerad runt ett medelvärde med två symmetriskt avtagande svansar.
Om man gör en mätning av något som är normalfördelat kan sannolikheten att värdet hamnar inom intervallet a≤x≤b beräknas med integralen
I figuren nedan kan man se hur integralen påverkas när gränserna och parametrarna varieras.
En statistisk undersökning visade att låtarnas längd hos musiktjänsten "Lakumix" kan ses som normalfördelade med medelvärdet 3.75 minuter och standardavvikelsen 0.5 minuter. Ställ upp en täthetsfunktion som beskriver fördelningen av låtarnas längd och en integral som motsvarar sannolikheten att slumpmässigt välja en låt som är mellan 2.5 och 3.5 minuter lång.
Något som är normalfördelat kan beskrivas av täthetsfunktionen
Grafräknaren har en inbyggd funktion för att göra numeriska beräkningar på normalfördelningar. Man hittar den genom att trycka på DISTR (2nd + VARS), vilket leder till en meny med kommandon för flera olika täthetsfunktioner.
Om man har en normalfördelning med ett givet medelvärde och standardavvikelse kan man använda kommandot normalcdf för att beräkna sannolikheten att en händelse faller inom ett visst intervall.
I exemplet ovan visas alltså hur man kan beräkna P(x≤4) för medelvärdet μ=5 och standardavvikelsen σ=1 med integralen
Ängla och Ärling sommarjobbar med att plocka äpplen. Hur många kilo de plockar per dag kan ses som normalfördelat. Ängla har medelvärdet 160 kg per dag med standardavvikelsen 10 kg medan Ärling har medelvärdet 150 kg med standardavvikelsen 15 kg. Om man antar att mängderna de plockar är oberoende av varandra, hur stor är sannolikheten att båda plockar mer än 170 kg under samma dag? Svara i procent med en decimal.
För att bestämma sannolikheten att båda plockar mer än 170 kg bestämmer vi först sannolikheten att de gör det var för sig. Vi börjar med Ängla, som har medelvärdet 160 och standardavvikelsen 10. Vi beräknar sannolikheten från 170 upp till 1099, vilket motsvarar alla värden över 170.
Vi gör sedan samma sak för Ärling, och då måste vi byta ut medelvärdet mot 150 och standardavvikelsen mot 15.
I Geogebra finns funktionen Normalfördelning() som kan användas för att göra numeriska beräkningar på normalfördelningar. Eftersom beräkningen måste ske numeriskt bör man använda classic-versionen av Geogebra. Om man skriver in ordet Normalfördelning på en tom rad dyker följande förslag upp.
Normalfördelning( <Medelvärde>, <Standardavvikelse>, <Variabelvärde> )
Sannolikheten att x är mindre än 2 för en normalfördelning med medelvärde 3 och standardavvikelsen 1 kan alltså beräknas på följande vis.
Normalfördelning(3,1,2)
→0.16
Om man istället skulle få ett svar på följande form innebär det att man använde CAS-versionen av Geogebra.
Normalfördelning(3, 1, 2)
→2erf(−22)+1
Då kan man antingen klicka på ≈-tecknet i den övre menyraden för att få en numerisk approximation, eller byta till classic-versionen av Geogebra. För att beräkna sannolikheten att ett resultat hamnar inom ett intervall, alltså P(a≤x≤b), kan man se sannolikheten som en differens mellan två kumulativa sannolikheter.
Vi vet att potatisens vikt är normalfördelad runt medelvärdet 120 g och har standardavvikelsen 40 g.
Vår uppgift är att bestämma de vikter som avgränsar de minsta 13 % och de största 23 %. Vi kan illustrera dessa sannolikheter som områden under kurvan, och kallar då viktgränserna för a respektive b.
Det nedre området motsvarar integralen ∫_(-∞)^af(x) d x =0.13, där f(x) är täthetsfunktionen för normalfördelningen i fråga. Det övre området motsvarar istället integralen ∫_b^(∞)f(x) d x =0.23. För att bestämma de okända viktgränserna testar vi oss fram med räknarens funktion normalcdf, där man sätter in undre och övre integrationsgränser, medelvärdet samt standardavvikelsen. Vi kan börja med att undersöka värdet på a och testar med a=80. Den undre gränsen, negativa oändligheten, kan approximeras med -10^(99).
Sannolikheten att en potatis väger mindre än 80 gram är alltså ca 16 %. För att få resultatet 13 % måste vi testa med en lägre vikt.
a | normalcdf |
---|---|
79 | 0.15268... |
78 | 0.14685... |
77 | 0.14118... |
76 | 0.13566... |
75 | 0.13029... |
74 | 0.12507... |
Om vi sätter a till 75 g kommer maskinen sålla bort lite drygt 13 %, vilket får anses vara tillräckligt exakt. Nu undersöker vi vilket värde b motsvarar och börjar med att testa b=145. Vi använder värdet 10^(99) som en approximation för oändligheten.
Vi får att ungefär 27 % av potatisarna väger över 145 gram. Eftersom vi vill att endast 23 % ska sållas bort måste vi höja viktgränsen.
a | normalcdf |
---|---|
146 | 0.25784... |
147 | 0.24983... |
148 | 0.24196... |
149 | 0.23422... |
150 | 0.22662... |
Vi kommer så nära 23 % som möjligt genom att sätta b till 150 g. Maskinen ska alltså ställas in på gränserna 75 g och 150 g för att sålla bort rätt mängd potatis.
På räknaren finns det ett kommando som heter invNorm under menyn DISTR (2nd + VARS).
Sätter man 12.7 som en övre gräns kan man alltså förvänta sig att ungefär 65% av utfallen hamnar under den. Använd kommandot invNorm för att lösa följande uppgift.
Eftersom företaget smälter ner de 25 % av spikarna som är smalast och de 25 % som är tjockast kommer 50 % som ligger i mitten att vara kvar.
Vi söker tjockleken på den smalaste och tjockaste av dessa spikar som finns kvar. Det är en stor mängd spikar som har tillverkats, så vi kan anta att de kommer att följa normalfördelningen väl. Det betyder att de smalaste och tjockaste spikarna kommer att finnas vid den lägre respektive övre gränsen på det markerade området, alltså vid a och b.
Funktionen invNorm beräknar en övre gräns för en given andel av fördelningen. För att kunna använda den måste vi då undersöka den övre gränsen till de smalaste 25 % av spikarna istället för den undre gränsen till mittenområdet.
Vi trycker på DISTR (2nd + VARS) och väljer invNorm. Vi skriver sedan sedan den andel vi är ute efter, alltså 0.25, följt av medelvärdet och standardavvikelsen för normalfördelningen.
Den smalaste spiken kommer alltså att vara ungefär 5.53 mm bred.
Den totala andelen av fördelningen som ligger under den övre gränsen är 25 % + 50 % = 75 %. Vi ber alltså invNorm att bestämma den övre gräns som ger andelen 0.75 för normalfördelningen.
Man kan alltså förvänta sig att den tjockaste spiken kommer att vara ungefär 6.47 mm bred.
Kommandot som Ärla har använt beräknar sannolikheten att ett utfall är mindre än eller lika med ett visst värde. Detta värde kallas variabelvärde i kommandot och anges som tredje tal på varje rad. Det första och andra talet anger medelvärdet respektive standardavvikelsen för fördelningen.
Normalfördelning( <Medelvärde>, <Standardavvikelse>, <Variabelvärde> )
Vi tittar på de tre raderna Ärla skrivit in. &Normalfördelning(7, 5, 2.5) &Normalfördelning(2, 5, -2.5) &Normalfördelning(19.5, 5, 15) Vi kan se att standardavvikelserna är samma för alla fördelningar, men att medelvärdena är olika. Det innebär att kurvorna ser likadana ut men är förskjutna i sidled i förhållande till varandra. Vi ritar respektive täthetsfunktion med något digitalt verktyg för att se hur de ser ut. Första funktionen får vi genom att sätta in μ=7 samt σ=5 i f(x) = 1/σsqrt(2π) * e^(- 12( x-μσ )^2). Vi får övriga två funktioner på motsvarande sätt.
Den övre gränserna på områdena är 4.5 le. till vänster om medelvärdet för alla kurvor. Eftersom standardavvikelsen är samma för de tre kurvorna blir områdena lika stora.
Detta innebär att även sannolikheterna som områdena beskriver är lika stora, vilket är anledningen till att Ärla fick samma resultat för de tre inmatningarna.
För att avgöra vem som har rätt utan att beräkna sannolikheterna försöker vi tolka normalfördelningarna grafiskt.
I Leilas uppgift är medelvärdet 4 och standardavvikelsen 1. Vi ritar upp täthetsfunktionen.
Leila ska beräkna sannolikheten P(1≤ x ≤3). Den skulle kunna räknas ut med en integral, alltså området under kurvan mellan 1 och 3. Istället för att beräkna så markerar vi området mellan x=1 och x=3, dvs. μ-3σ och μ-σ.
Svaret på Leilas uppgift är alltså området mellan första och tredje standardavvikelsen.
Vi gör på samma sätt med Måns uppgift och ritar upp täthetsfunktionen för normalfördelningar med medelvärdet 5.5 och standardavvikelsen 1.5.
I upggiften ska sannolikheten mellan P(7 ≤ x≤10) räknas ut. Om vi tittar på grafen ovan så är det området under kurvan mellan x=7 och x=10.
Det är alltså området mellan en och tre standardavvikelser. Både Leilas och Måns resultat hamnar mellan en och tre standardavvikelser men på olika sidor om medelvärdet. Eftersom en normalfördelning har samma spridning till vänster och höger om medelvärdet kommer Leila och Måns få samma svar.