Sannolikheter för normalfördelningar

{{ 'ml-heading-theory' | message }}

En av de vanligaste sannolikhetsfördelningarna är normalfördelningen, som kan användas för att beskriva många egenskaper i naturen. Till exempel är längder och vikter ofta normalfördelade. Fördelningen är centrerad runt ett medelvärde med två symmetriskt avtagande svansar.

Medelvärdet μ\mu ("my") anger normalfördelningens mittpunkt medan standardavvikelsen σ\sigma ("sigma") är ett mått på spridningen.
Begrepp

Täthetsfunktion för normalfördelningen

För normalfördelningen gäller täthetsfunktionen f(x)=1σ2πe-12(xμσ)2 f(x) = \dfrac{1}{\sigma\sqrt{2\pi}} \cdot e^{{\normalsize \text{-} \frac{1}{2}\left( \tfrac{x-\mu}{\sigma} \right)}^{\scriptstyle 2}} som definieras av medelvärdet μ\mu och standardavvikelsen σ.\sigma. En normalfördelning med medelvärdet 00 och standardavvikelsen 11 ser ut som i figuren.

Om man gör en mätning av något som är normalfördelat kan sannolikheten att värdet hamnar inom intervallet axba \leq x \leq b beräknas med integralen

P(axb)=abf(x)dx. P(a \leq x \leq b) = \displaystyle\int_{a}^{b}f(x) \, \text d x .

Integralens värde påverkas av gränserna och parametrarna i täthetsfunktionen. Medelvärdet förskjuter kurvan i sidled medan standardavvikelsen påverkar hur snabbt den avtar. För att beräkna en sannolikhet för ett öppet intervall, t.ex. P(x4),P(x \geq 4), sätter man någon av gränserna till antingen -\text{-} \infty eller .\infty. En sådan integral kallas generaliserad och tolkas som ett gränsvärde. af(x)dx=limbabf(x)dx \displaystyle\int_{a}^{\infty}f(x) \, \text d x = \lim\limits_{b \to \infty} \displaystyle\int_{a}^{b}f(x) \, \text d x

I figuren nedan kan man se hur integralen påverkas när gränserna och parametrarna varieras.

Det går inte att beräkna dessa integraler algebraiskt eftersom det inte existerar någon primitiv funktion till f(x)f(x) som kan uttryckas algebraiskt. Det innebär att man måste använda numeriska metoder för att beräkna dem, t.ex. med hjälp av räknare eller Geogebra.
Uppgift

En statistisk undersökning visade att låtarnas längd hos musiktjänsten "Lakumix" kan ses som normalfördelade med medelvärdet 3.753.75 minuter och standardavvikelsen 0.50.5 minuter. Ställ upp en täthetsfunktion som beskriver fördelningen av låtarnas längd och en integral som motsvarar sannolikheten att slumpmässigt välja en låt som är mellan 2.52.5 och 3.53.5 minuter lång.

Lösning

Något som är normalfördelat kan beskrivas av täthetsfunktionen

f(x)=1σ2πe-12(xμσ)2, f(x) = \dfrac{1}{\sigma\sqrt{2\pi}} \cdot e^{{\normalsize \text{-} \frac{1}{2}\left( \tfrac{x-\mu}{\sigma} \right)}^{\scriptstyle 2}}, där μ\mu är medelvärdet och σ\sigma är standardavvikelsen. I det här fallet är medelvärdet 3.753.75 minuter, standardavvikelsen är 0.50.5 minuter och variabeln xx representerar låtlängden. Vi får då täthetsfunktionen f(x)=10.52πe-12(x3.750.5)2. f(x) = \dfrac{1}{0.5 \sqrt{2\pi}} \cdot e^{{\normalsize \text{-} \frac{1}{2}\left( \tfrac{x-3.75}{0.5} \right)}^{\scriptstyle 2}}. Om man integrerar en täthetsfunktion mellan aa och bb får man sannolikheten för ett utfall inom det intervallet. I det här fallet ska vi alltså ställa upp en integral av f(x)f(x) mellan 2.52.5 och 3.5.3.5. P(2.5x3.5)=2.53.510.52πe-12(x3.750.5)2dx P(2.5 \leq x \leq 3.5) = \displaystyle\int_{2.5}^{3.5}\dfrac{1}{0.5 \sqrt{2\pi}} \cdot e^{{\normalsize \text{-} \frac{1}{2}\left( \tfrac{x-3.75}{0.5} \right)}^{\scriptstyle 2}} \, \text d x

Visa lösning Visa lösning
Digitala verktyg

Normalfördelning på räknare

Grafräknaren har en inbyggd funktion för att göra numeriska beräkningar på normalfördelningar. Man hittar den genom att trycka på DISTR (2nd + VARS), vilket leder till en meny med kommandon för flera olika täthetsfunktioner.

DISTR-menyn på en TI-82-räknare

Om man har en normalfördelning med ett givet medelvärde och standardavvikelse kan man använda kommandot normalcdf för att beräkna sannolikheten att en händelse faller inom ett visst intervall.

Sannolikhetsberäkning med normalfördelning på TI-82-räknare

Inom parentesen anger man fyra parametrar separerade med komman: de undre och övre integrationsgränserna, medelvärdet och sist standardavvikelsen. Beräkningen ovan motsvarar alltså integralen 47132πe-12(x53)2dx. \displaystyle\int_{4}^{7}\dfrac{1}{3\sqrt{2\pi}} \cdot e^{{\normalsize \text{-} \frac{1}{2} \left( \frac{x-5}{3} \right)}^{\scriptstyle 2}} \, \text d x . Eftersom räknaren gör dessa beräkningar numeriskt går det inte att sätta gränserna till oändligheten för att beräkna sannolikheten att ett resultat ligger under eller över ett visst värde. Man kan dock sätta in -1099\text{-}10^{99} eller 1099,10^{99}, som i praktiken oftast ger samma resultat som -\text{-} \infty respektive .\infty.

Sannolikhetsberäkning med normalfördelning på TI-82-räknare

I exemplet ovan visas alltså hur man kan beräkna P(x4)P(x\leq4) för medelvärdet μ=5\mu=5 och standardavvikelsen σ=1\sigma=1 med integralen

-4112πe-12(x51)2dx. \displaystyle\int_{\text{-} \infty}^{4}\dfrac{1}{1\sqrt{2\pi}} \cdot e^{{\normalsize \text{-} \frac{1}{2} \left( \frac{x-5}{1} \right)}^{\scriptstyle 2}} \, \text d x .
Uppgift

Ängla och Ärling sommarjobbar med att plocka äpplen. Hur många kilo de plockar per dag kan ses som normalfördelat. Ängla har medelvärdet 160160 kg per dag med standardavvikelsen 1010 kg medan Ärling har medelvärdet 150150 kg med standardavvikelsen 1515 kg. Om man antar att mängderna de plockar är oberoende av varandra, hur stor är sannolikheten att båda plockar mer än 170170 kg under samma dag? Svara i procent med en decimal.

Lösning

För att bestämma sannolikheten att båda plockar mer än 170170 kg bestämmer vi först sannolikheten att de gör det var för sig. Vi börjar med Ängla, som har medelvärdet 160160 och standardavvikelsen 10.10. Vi beräknar sannolikheten från 170170 upp till 1099,10^{99}, vilket motsvarar alla värden över 170.170.

Sannolikhetsberäkning med normalfördelning på TI-82-räknare

Vi gör sedan samma sak för Ärling, och då måste vi byta ut medelvärdet mot 150150 och standardavvikelsen mot 15.15.

Sannolikhetsberäkning med normalfördelning på TI-82-räknare

Sannolikheten att Ängla plockar över 170170 kg är alltså ungefär 0.158660.15866 och för Ärling är den 0.09121.0.09121. Eftersom det är oberoende händelser räcker det med att multiplicera dem för att få sannolikheten att båda plockar mer än 170170 kg. 0.158660.09121=0.014470.014=1.4% 0.15866 \cdot 0.09121 = 0.01447\ldots \approx 0.014 = 1.4\,\% Det är alltså ungefär 1.4%1.4\,\% chans att de båda lyckas plocka mer än 170170 kg äpplen samma dag.

Visa lösning Visa lösning
Digitala verktyg

Normalfördelning med Geogebra

I Geogebra finns funktionen Normalfördelning() som kan användas för att göra numeriska beräkningar på normalfördelningar. Eftersom beräkningen måste ske numeriskt bör man använda classic-versionen av Geogebra. Om man skriver in ordet Normalfördelning på en tom rad dyker följande förslag upp.

Normalfördelning( <Medelvärde>, <Standardavvikelse>, <Variabelvärde> )

Det funktionen beräknar är den så kallade kumulativa sannolikheten för ett variabelvärde, t.ex. x=b,x = b, som är definierat som P(xb).P(x \leq b). Den beräknar alltså sannolikheten att xx är mindre än eller lika med b.b. För täthetsfunktionen f(x)f(x) motsvarar det P(xb)=-bf(x)dx. P(x \leq b) = \displaystyle\int_{\text{-} \infty}^{b}f(x) \, \text d x .

Sannolikheten att xx är mindre än 22 för en normalfördelning med medelvärde 33 och standardavvikelsen 11 kan alltså beräknas på följande vis.

Normalfördelning(3,1,23, 1, 2)

0.16\rightarrow \quad \mathbf{0.16}

Denna beräkning motsvarar integralen -2112πe-12(x31)2dx0.16. \displaystyle\int_{\text{-} \infty}^{2}\dfrac{1}{1\sqrt{2\pi}} \cdot e^{{\normalsize \text{-} \frac{1}{2} \left( \frac{x-3}{1 } \right)}^{\scriptstyle 2}} \, \text d x \approx 0.16.

Om man istället skulle få ett svar på följande form innebär det att man använde CAS-versionen av Geogebra.

Normalfördelning(3, 1, 2)

erf(22)+12\rightarrow \quad \mathbf{\dfrac{erf\left( -\frac{\sqrt{2}}{2} \right) + 1}{2}}

Då kan man antingen klicka på \approx-tecknet i den övre menyraden för att få en numerisk approximation, eller byta till classic-versionen av Geogebra. För att beräkna sannolikheten att ett resultat hamnar inom ett intervall, alltså P(axb),P(a \leq x \leq b), kan man se sannolikheten som en differens mellan två kumulativa sannolikheter.

Uppgifter

{{ 'mldesktop-placeholder-grade-tab' | message }}
{{ 'mldesktop-placeholder-grade' | message }} {{ article.displayTitle }}!
{{ grade.displayTitle }}
{{ exercise.headTitle }}
{{ 'ml-btn-focusmode-tooltip' | message }} settings_overscan
Test
{{ 'mldesktop-selftest-notests' | message }} {{ article.displayTitle }}!
{{ tests.error }}

{{ 'ml-heading-exercise' | message }} {{ focusmode.exercise.exerciseName }}

keyboard_backspace
{{ section.title }} keyboard_backspace {{ 'ml-btn-previous' | message }} {{ 'ml-btn-previous-exercise' | message }} {{ 'ml-btn-next-exercise' | message }} keyboard_backspace {{ 'ml-btn-next-exercise' | message }}