Logga in
| 6 sidor teori |
| 11 Uppgifter - Nivå 1 - 3 |
| Varje lektion är menad motsvara 1-2 lektioner i klassrummet. |
En av de vanligaste sannolikhetsfördelningarna är normalfördelningen, som kan användas för att beskriva många egenskaper i naturen. Till exempel är längder och vikter ofta normalfördelade. Fördelningen är centrerad runt ett medelvärde med två symmetriskt avtagande svansar.
Om man gör en mätning av något som är normalfördelat kan sannolikheten att värdet hamnar inom intervallet a≤x≤b beräknas med integralen
I figuren nedan kan man se hur integralen påverkas när gränserna och parametrarna varieras.
En statistisk undersökning visade att låtarnas längd hos musiktjänsten "Lakumix" kan ses som normalfördelade med medelvärdet 3.75 minuter och standardavvikelsen 0.5 minuter. Ställ upp en täthetsfunktion som beskriver fördelningen av låtarnas längd och en integral som motsvarar sannolikheten att slumpmässigt välja en låt som är mellan 2.5 och 3.5 minuter lång.
Något som är normalfördelat kan beskrivas av täthetsfunktionen
Grafräknaren har en inbyggd funktion för att göra numeriska beräkningar på normalfördelningar. Man hittar den genom att trycka på DISTR (2nd + VARS), vilket leder till en meny med kommandon för flera olika täthetsfunktioner.
Om man har en normalfördelning med ett givet medelvärde och standardavvikelse kan man använda kommandot normalcdf för att beräkna sannolikheten att en händelse faller inom ett visst intervall.
I exemplet ovan visas alltså hur man kan beräkna P(x≤4) för medelvärdet μ=5 och standardavvikelsen σ=1 med integralen
Ängla och Ärling sommarjobbar med att plocka äpplen. Hur många kilo de plockar per dag kan ses som normalfördelat. Ängla har medelvärdet 160 kg per dag med standardavvikelsen 10 kg medan Ärling har medelvärdet 150 kg med standardavvikelsen 15 kg. Om man antar att mängderna de plockar är oberoende av varandra, hur stor är sannolikheten att båda plockar mer än 170 kg under samma dag? Svara i procent med en decimal.
För att bestämma sannolikheten att båda plockar mer än 170 kg bestämmer vi först sannolikheten att de gör det var för sig. Vi börjar med Ängla, som har medelvärdet 160 och standardavvikelsen 10. Vi beräknar sannolikheten från 170 upp till 1099, vilket motsvarar alla värden över 170.
Vi gör sedan samma sak för Ärling, och då måste vi byta ut medelvärdet mot 150 och standardavvikelsen mot 15.
Funktionen normalcdf används för att beräkna sannolikheten för normalfördelningar. Det betyder att Imin har beräknat en integral av täthetsfunktionen för en normalfördelning: ∫_a^b1/σsqrt(2π) * e^(- 12( x-μσ )^2) d x . Värdena Imin angav i funktionen på räknaren beskriver integralen. De första två värdena är den undre och övre integrationsgränsen. Sen kommer medelvärdet och sist standardavvikelsen. Det betyder att Imins integrationsgränser var 1 och 3, medelvärdet μ = 10 och standardavvikelsen σ = 5. Integralen blir då: ∫_1^31/5sqrt(2π) * e^(- 12( x-105 )^2) d x . Integralen beräknar därför sannolikheten för ett utfall mellan värdena 1 och 3 för en normalfördelad händelse med medelvärde 10 och standardavvikelse 5.
Ett vanligt sätt att visa en generell normalfördelning är följande bild.
Här visas intervall som är en standardavvikelse breda och de sannolikheter detta leder till. Använd en normalfördelning med medelvärde 0 och standardavvikelse 1 för att beräkna och bekräfta dessa sannolikheter.
Vi börjar med att sätta in medelvärdet μ = 0 och standardavvikelsen σ = 1 för att bestämma gränserna till vår fördelning. Det spelar egentligen ingen roll vilka värden man använder, det blir samma sannolikheter oavsett vilket μ och σ man väljer, men 0 och 1 ger enkla gränser.
Vi vill nu bekräfta de sannolikheter som finns markerade på intervallen. Det kan vi t.ex. göra med funktionen normalcdf på räknaren. Vi kan börja med området mellan 0 och 1.
Vi använder funktionen genom att trycka på DISTR (2nd + VARS) och välja normalcdf( från menyn. Man skriver sedan in gränserna till det intervall man vill undersöka, alltså 0 och 1, följt av medelvärde och standardavvikelse för normalfördelningen, alltså 0 och 1.
Sannolikheten att hamna inom intervallet från 0 till 1 är alltså 0.34134... ≈ 0.341 = 34.1 %. Vi fortsätter sedan med området mellan 1 och 2.
Vi använder normalcdf igen, den här gången med gränserna 1 och 2.
Vi får sannolikheten 0.13590... ≈ 0.136 = 13.6 %, precis som väntat. Området längst till höger har ingen övre gräns utan fortsätter mot oändligheten.
Vi kan inte skriva in oändligheten på räknaren, men vi kan sätta in ett väldigt stort tal, t.ex. 10^(99), vilket kommer att ge ett bra närmevärde. Gränserna blir alltså 2 och 10^(99).
Även denna sannolikhet stämmer: 0.02275... ≈ 0.023 = 2.3 %. Vi har nu sannolikheter för alla intervall ovanför 0.
Nu skulle vi kunna göra motsvarande beräkningar för intervallen under 0 men det går också att utnyttja att kurvan är symmetrisk runt 0. Exempelvis är området mellan -1 och 0 precis lika stort som det mellan 0 och 1, och då måste även sannolikheten vara lika stor. Vi får därför följande sannolikheter.
Detta är precis de sannolikheter vi skulle visa.
Vi får inte medelvärdet för normalfördelningen utskrivet i uppgiften, men vi kan nog anta att det bör vara det korrekta värdet, alltså 1000 gram. Normalfördelningen som beskriver vågens mätvärden för kilovikten har alltså μ = 1000g och σ = 25 g. Vi vill uppskatta hur många gånger Guillermo kommer att få en vikt över 1020 gram under en 10-dagarsperiod, och för det behöver vi först sannolikheten att vågen visar över 1020 gram vid en mätning. För att beräkna sannolikheten använder vi funktionen normalcdf på räknaren, som beräknar sannolikheten att en mätning hamnar inom ett givet intervall för en normalfördelning.
Vi vill beräkna sannolikheten att vikten är över 1020 gram, så vi skriver först in den undre gränsen 1020 följt av den övre gränsen 10^(99), som får representera oändligheten. Sedan skriver vi in medelvärdet 1000 och standardavvikelsen 25.
Sannolikheten att få en mätning över 1020 gram är alltså ungefär 0.2119. Gör man många mätningar kan man då förvänta sig att denna andel av dem kommer att vara över 1020 gram. Guillermo gör 10 mätningar varje dag under en 10-dagarsperiod, alltså totalt 10 * 10 = 100 mätningar. Av dessa bör då 0.2119 * 100 = 21.19 ≈ 21 vara över 1020 gram.
En gymnastiklärare upptäcker att resultatet från ett löptest kan beskrivas som en normalfördelning med medelvärdet 700 sekunder och standardavvikelsen 125 sekunder. De tider man måste slå för att få ett visst betyg visas i tabellen nedan.
Betyg | Gräns |
---|---|
E | 1000 s |
D | 800 s |
C | 750 s |
B | 675 s |
A | 550 s |
Om vi skissar den normalfördelning som beskrivs och sätter ut betygsgränserna får vi något som ser ut på följande sätt.
Man får ett visst betyg om man springer snabbare än den angivna tiden i tabellen. Det måste alltså vara intervallet som ligger till vänster om en viss betygsgräns som ger motsvarande betyg. Vi är intresserade av betyget B, som man får om man springer på en tid mellan 550 och 675 sekunder.
Vi kan t.ex. beräkna sannolikheten för detta intervall med hjälp av funktionen normalcdf, som finns under menyn DISTR (2nd + VARS) på räknaren. Då skriver vi först in gränserna på intervallet vi vill beräkna, 550 och 675, följt av medelvärdet och standardavvikelsen för normalfördelningen, alltså 700 respektive 125.
Vi får ungefär 0.31, vilket innebär att sannolikheten att en slumpvis vald elev har betyget B är ca 31 %.
Sadie vet alltså att det finns ett kommando för att beräkna sannolikheten att utfallet, som vi kan kalla x, är mindre än eller lika med 120. Detta kommando går faktiskt att använda även när vi vill beräkna sannolikheten att x är större än 120, eftersom summan av dessa sannolikheter är lika med 1: P(x≤120)+P(x>120)=1.
Det ger att P(x>120)=1 - P(x≤120). Vi kan alltså bestämma P(x>120) genom att beräkna P(x≤120) med Geogebra och sedan subtrahera den sannolikheten från 1. Vi använder kommandot Normalfördelning i classic-versionen av Geogebra och skriver in medelvärdet 100, standardavvikelsen 35, och variabelvärdet 120.
Normalfördelning(100, 35, 120)
→ 0.72
Nu vet vi att P(x≤120) ≈ 0.72 och använder det för att beräkna den sökta sannolikheten. P(x>120) ≈ 1 - 0.72=0.28 Sannolikheten att utfallet är större än 120 är alltså ungefär 0.28.