Logga in
Denna lektion kommer lära dig teorin för att helt förstå ämnet, och det finns både uppgifter och självtester för att kontrollera din förståelse.
| | 6 sidor teori |
| | 11 Uppgifter - Nivå 1 - 3 |
| | Varje lektion är menad motsvara 1-2 lektioner i klassrummet. |
En av de vanligaste sannolikhetsfördelningarna är normalfördelningen, som kan användas för att beskriva många egenskaper i naturen. Till exempel är längder och vikter ofta normalfördelade. Fördelningen är centrerad runt ett medelvärde med två symmetriskt avtagande svansar.
För normalfördelningen gäller täthetsfunktionen f(x) = 1/σsqrt(2π) * e^(- 12( x-μσ )^2) som definieras av medelvärdet μ och standardavvikelsen σ. En normalfördelning med medelvärdet 0 och standardavvikelsen 1 ser ut som i figuren.
Om man gör en mätning av något som är normalfördelat kan sannolikheten att värdet hamnar inom intervallet a ≤ x ≤ b beräknas med integralen
P(a ≤ x ≤ b) = ∫_a^bf(x) d x .
Integralens värde påverkas av gränserna och parametrarna i täthetsfunktionen. Medelvärdet förskjuter kurvan i sidled medan standardavvikelsen påverkar hur snabbt den avtar. För att beräkna en sannolikhet för ett öppet intervall, t.ex. P(x ≥ 4), sätter man någon av gränserna till antingen - ∞ eller ∞. En sådan integral kallas generaliserad och tolkas som ett gränsvärde. ∫_a^(∞)f(x) d x = lim _(b → ∞) ∫_a^bf(x) d x
I figuren nedan kan man se hur integralen påverkas när gränserna och parametrarna varieras.
Något som är normalfördelat kan beskrivas av täthetsfunktionen
f(x) = 1/σsqrt(2π) * e^(- 12( x-μσ )^2),
där μ är medelvärdet och σ är standardavvikelsen. I det här fallet är medelvärdet 3.75 minuter, standardavvikelsen är 0.5 minuter och variabeln x representerar låtlängden. Vi får då täthetsfunktionen
f(x) = 1/0.5 sqrt(2π) * e^(- 12( x-3.750.5 )^2).
Om man integrerar en täthetsfunktion mellan a och b får man sannolikheten för ett utfall inom det intervallet. I det här fallet ska vi alltså ställa upp en integral av f(x) mellan 2.5 och 3.5.
P(2.5 ≤ x ≤ 3.5) = ∫_(2.5)^(3.5)1/0.5 sqrt(2π) * e^(- 12( x-3.750.5 )^2) d x
Grafräknaren har en inbyggd funktion för att göra numeriska beräkningar på normalfördelningar. Man hittar den genom att trycka på DISTR (2nd + VARS), vilket leder till en meny med kommandon för flera olika täthetsfunktioner.
Om man har en normalfördelning med ett givet medelvärde och standardavvikelse kan man använda kommandot normalcdf för att beräkna sannolikheten att en händelse faller inom ett visst intervall.
Inom parentesen anger man fyra parametrar separerade med komman: de undre och övre integrationsgränserna, medelvärdet och sist standardavvikelsen. Beräkningen ovan motsvarar alltså integralen ∫_4^71/3sqrt(2π) * e^(- 12 ( x-53 )^2) d x . Eftersom räknaren gör dessa beräkningar numeriskt går det inte att sätta gränserna till oändligheten för att beräkna sannolikheten att ett resultat ligger under eller över ett visst värde. Man kan dock sätta in -10^(99) eller 10^(99), som i praktiken oftast ger samma resultat som - ∞ respektive ∞.
I exemplet ovan visas alltså hur man kan beräkna P(x≤4) för medelvärdet μ=5 och standardavvikelsen σ=1 med integralen
∫_(- ∞)^41/1sqrt(2π) * e^(- 12 ( x-51 )^2) d x .För att bestämma sannolikheten att båda plockar mer än 170 kg bestämmer vi först sannolikheten att de gör det var för sig. Vi börjar med Ängla, som har medelvärdet 160 och standardavvikelsen 10. Vi beräknar sannolikheten från 170 upp till 10^(99), vilket motsvarar alla värden över 170.
Vi gör sedan samma sak för Ärling, och då måste vi byta ut medelvärdet mot 150 och standardavvikelsen mot 15.
Sannolikheten att Ängla plockar över 170 kg är alltså ungefär 0.15866 och för Ärling är den 0.09121. Eftersom det är oberoende händelser räcker det med att multiplicera dem för att få sannolikheten att båda plockar mer än 170 kg. 0.15866 * 0.09121 = 0.01447... ≈ 0.014 = 1.4 % Det är alltså ungefär 1.4 % chans att de båda lyckas plocka mer än 170 kg äpplen samma dag.
I Geogebra finns funktionen Normalfördelning() som kan användas för att göra numeriska beräkningar på normalfördelningar. Eftersom beräkningen måste ske numeriskt bör man använda classic-versionen av Geogebra. Om man skriver in ordet Normalfördelning på en tom rad dyker följande förslag upp.
Sannolikheten att x är mindre än 2 för en normalfördelning med medelvärde 3 och standardavvikelsen 1 kan alltså beräknas på följande vis.
Om man istället skulle få ett svar på följande form innebär det att man använde CAS-versionen av Geogebra.
Då kan man antingen klicka på ≈-tecknet i den övre menyraden för att få en numerisk approximation, eller byta till classic-versionen av Geogebra. För att beräkna sannolikheten att ett resultat hamnar inom ett intervall, alltså P(a ≤ x ≤ b), kan man se sannolikheten som en differens mellan två kumulativa sannolikheter.
Givet normalfördelningen f(x) = 1/2sqrt(π) * e^(- ( - 3 - x2 )^2), bestäm μ och σ.
Från funktionsuttrycket måste vi identifiera konstanterna μ och σ, men normalfördelningen står inte på vanlig form: f(x) = 1/σsqrt(2π) * e^(- 12( x-μσ )^2). Vi börjar genom att skriva om faktorn innan potensen så att vi kan identifiera standardavvikelsen σ. Vi måste då skriva om faktorn 2 i nämnaren som sqrt(2) * sqrt(2) för att få sqrt(2π) i nämnaren.
Vi kan alltså skriva täthetsfunktionen som
f(x) = 1/sqrt(2) * sqrt(2π) * e^(- ( - 3 - x2 )^2),
och kan nu identifiera att σ = sqrt(2). För att ta reda på vad μ är kan vi likställa exponenten vi har med den för allmänna normalfördelningar, alltså
- ( - 3 - x/2 )^2 = - 1/2( x-μ/σ )^2.
Genom att sätta in σ = sqrt(2) kan vi bestämma μ.
Vi skulle här kunna utveckla parenteserna för att lösa ut μ, men det är lättare att göra en omskrivning av ena ledet för att identifiera konstanten. Man kan ändra tecken på tal som kvadreras utan att de ändrar värde.
Vi kan nu identifiera att μ = - 3. Normalfördelningen har alltså medelvärdet μ = - 3 och standardavvikelsen σ = sqrt(2).
För att identifiera μ kan vi istället göra en omskrivning av exponenten,
- ( - 3 - x/2 )^2,
så den stor på vanlig form för en normalfördelning. Vi vet att σ = sqrt(2), alltså måste vi dela upp nämnaren i sqrt(2) * sqrt(2) och flytta ena faktorn utanför parentesen.
Till sist behöver vi skriva om täljaren i exponenten så att den står på formen x - μ. Eftersom parentesen kvadreras kan vi byta tecken på det innanför utan att det påverkar exponentens värde.
Täthetsfunktionen kan skrivas på formen f(x) = 1/sqrt(2) * sqrt(2π) * e^(- 12 ( x - (- 3)sqrt(2) )^2). Vi har alltså en normalfördelning med medelvärdet μ = - 3 och standardavvikelsen σ = sqrt(2).
Han tittar på sitt verk och inser att han inte är helt säker på vad det är han egentligen tagit fram.
Till att börja med kan vi direkt säga att f(x) inte kan vara en täthetsfunktion. I så fall hade arean under grafen varit 1, vilken den definitivt inte är. Om vi tittar på integranden ser vi dock något som ser lite mer bekant ut. Den integreras med avseende på variabeln t, så vi kan kalla den h(t). h(t) = 1/5sqrt(2π) * e^(- 12( t-45 )^2) Den här funktionen kan vi identifiera som täthetsfunktionen till en normalfördelning med medelvärdet μ = 4 och standardavvikelsen σ = 5. Det funktionen f(x) gör är att integrera denna täthetsfunktion från -∞ till x. f(x) = ∫_(-∞)^xh(t) d t Om man beräknar f(8) integrerar man alltså från -∞ till 8. Ritar man ut täthetsfunktionen h(t) skulle man då kunna visualisera integralen som arean under grafen fram till t = 8.
Att f(8) ≈ 0,79 betyder alltså att sannolikheten att temperaturen är under 8^(∘)C den dagen är 79 %. Mer generellt kan man sätta in vilket värde på x som helst och funktionen f(x) beräknar sannolikheten att temperaturen ligger under detta värde. Det är den så kallade kumulativa sannolikheten.
Vi ser här att f(x) går mot 0 för stora negativa x och mot 1 för stora positiva x. Detta är rimligt eftersom sannolikheten bör bli större och större ju fler temperaturer som inkluderas i beräkningen, och nå 1 när alla temperaturer är inkluderade.
För att tolka derivatan f'(x) börjar vi med att igen skriva f(x) som en integral över täthetsfunktionen h(t). f(x) = ∫_(-∞)^xh(t) d t Om vi nu antar att det finns en primitiv funktion H(x) till h(x) kan vi skriva om integralen med hjälp av integralkalkylens huvudsats. f(x) = ∫_(-∞)^xh(t) d t = [ H(x) ]_(-∞)^x Nu kan man inte riktigt sätta in -∞ i H(t), utan man får istället använda gränsvärdet lim _(t→ -∞) H(t). Då kan vi skriva funktionen som f(x) = [ H(x) ]_(-∞)^x = H(x) - lim _(t→ -∞) H(t). Vi kan gissa att gränsvärdet kommer vara 0, men det spelar inte så stor roll. Vi vet ju att det är konstant och inte beror på x, vilket räcker fint för oss eftersom vi tänker derivera f(x). Då försvinner gränsvärdet och vi behöver inte bry oss om vad det faktiskt är.
Vad är då derivatan av H(x)? Jo, det måste ju vara täthetsfunktionen h(x) eftersom vi specifikt definierade H(x) som en primitiv funktion till den. Vi får alltså f'(x) = h(x), och sätter vi in funktionsuttrycket får vi f'(x) = 1/5sqrt(2π) * e^(- 12( x-45 )^2). Om man deriverar den kumulativa sannolikhetsfunktionen får man alltså täthetsfunktionen med μ=4^(∘)C och σ=5^(∘)C.