Sannolikheter för normalfördelningar: Medelvärde och standardavvikelse

En av de vanligaste sannolikhetsfördelningarna är normalfördelningen, som kan användas för att beskriva många egenskaper i naturen. Till exempel är längder och vikter ofta normalfördelade. Fördelningen är centrerad runt ett medelvärde med två symmetriskt avtagande svansar.

Medelvärdet

μ

("my") anger normalfördelningens mittpunkt medan standardavvikelsen

σ

("sigma") är ett mått på spridningen.

Begrepp

Täthetsfunktion för normalfördelningen

För normalfördelningen gäller täthetsfunktionen

f (x) = \frac{1}{σ 2 π} \cdot e^{- \frac{1}{2} (\frac{x - μ}{σ})^{2}}

som definieras av medelvärdet

μ

och standardavvikelsen

σ .

En normalfördelning med medelvärdet

0

och standardavvikelsen

1

ser ut som i figuren.

Om man gör en mätning av något som är normalfördelat kan sannolikheten att värdet hamnar inom intervallet $a \leq x \leq b$ beräknas med integralen

P (a \leq x \leq b) = \int_{a}^{b} f (x) d x .

Integralens värde påverkas av gränserna och parametrarna i täthetsfunktionen. Medelvärdet förskjuter kurvan i sidled medan standardavvikelsen påverkar hur snabbt den avtar. För att beräkna en sannolikhet för ett öppet intervall, t.ex.

P (x \geq 4),

sätter man någon av gränserna till antingen

- \infty

eller

\infty .

En sådan integral kallas generaliserad och tolkas som ett gränsvärde.

\int_{a}^{\infty} f (x) d x = b \to \infty lim \int_{a}^{b} f (x) d x

I figuren nedan kan man se hur integralen påverkas när gränserna och parametrarna varieras.

Det går inte att beräkna dessa integraler algebraiskt eftersom det inte existerar någon primitiv funktion till

f (x)

som kan uttryckas algebraiskt. Det innebär att man måste använda numeriska metoder för att beräkna dem, t.ex. med hjälp av räknare eller Geogebra.

Ställ upp ett uttryck för sannolikheten

fullscreen

En statistisk undersökning visade att låtarnas längd hos musiktjänsten "Lakumix" kan ses som normalfördelade med medelvärdet $3.75$ minuter och standardavvikelsen $0.5$ minuter. Ställ upp en täthetsfunktion som beskriver fördelningen av låtarnas längd och en integral som motsvarar sannolikheten att slumpmässigt välja en låt som är mellan $2.5$ och $3.5$ minuter lång.

Visa Lösning

Något som är normalfördelat kan beskrivas av täthetsfunktionen

f (x) = \frac{1}{σ 2 π} \cdot e^{- \frac{1}{2} (\frac{x - μ}{σ})^{2}},

där

μ

är medelvärdet och

σ

är standardavvikelsen. I det här fallet är medelvärdet

3.75

minuter, standardavvikelsen är

0.5

minuter och variabeln

x

representerar låtlängden. Vi får då täthetsfunktionen

f (x) = \frac{1}{0 . 5 2 π} \cdot e^{- \frac{1}{2} (\frac{x - 3 . 7 5}{0 . 5})^{2}} .

Om man integrerar en täthetsfunktion mellan

a

och

b

får man sannolikheten för ett utfall inom det intervallet. I det här fallet ska vi alltså ställa upp en integral av

f (x)

mellan

2.5

och

3.5 .

P (2.5 \leq x \leq 3.5) = \int_{2.5}^{3.5} \frac{1}{0 . 5 2 π} \cdot e^{- \frac{1}{2} (\frac{x - 3 . 7 5}{0 . 5})^{2}} d x

Digitala verktyg

Normalfördelning på räknare

Grafräknaren har en inbyggd funktion för att göra numeriska beräkningar på normalfördelningar. Man hittar den genom att trycka på DISTR (2nd + VARS), vilket leder till en meny med kommandon för flera olika täthetsfunktioner.

Om man har en normalfördelning med ett givet medelvärde och standardavvikelse kan man använda kommandot normalcdf för att beräkna sannolikheten att en händelse faller inom ett visst intervall.

Sannolikhetsberäkning med normalfördelning på TI-82-räknare

Inom parentesen anger man fyra parametrar separerade med komman: de undre och övre integrationsgränserna, medelvärdet och sist standardavvikelsen. Beräkningen ovan motsvarar alltså integralen

\int_{4}^{7} \frac{1}{3 2 π} \cdot e^{- \frac{1}{2} (\frac{x - 5}{3})^{2}} d x .

Eftersom räknaren gör dessa beräkningar numeriskt går det inte att sätta gränserna till oändligheten för att beräkna sannolikheten att ett resultat ligger under eller över ett visst värde. Man kan dock sätta in

- 1 0^{99}

eller

1 0^{99},

som i praktiken oftast ger samma resultat som

- \infty

respektive

\infty .

I exemplet ovan visas alltså hur man kan beräkna $P (x \leq 4)$ för medelvärdet $μ = 5$ och standardavvikelsen $σ = 1$ med integralen

\int_{- \infty}^{4} \frac{1}{1 2 π} \cdot e^{- \frac{1}{2} (\frac{x - 5}{1})^{2}} d x .

Bestäm sannolikheten med räknare

fullscreen

Ängla och Ärling sommarjobbar med att plocka äpplen. Hur många kilo de plockar per dag kan ses som normalfördelat. Ängla har medelvärdet $160$ kg per dag med standardavvikelsen $10$ kg medan Ärling har medelvärdet $150$ kg med standardavvikelsen $15$ kg. Om man antar att mängderna de plockar är oberoende av varandra, hur stor är sannolikheten att båda plockar mer än $170$ kg under samma dag? Svara i procent med en decimal.

Visa Lösning

För att bestämma sannolikheten att båda plockar mer än $170$ kg bestämmer vi först sannolikheten att de gör det var för sig. Vi börjar med Ängla, som har medelvärdet $160$ och standardavvikelsen $10 .$ Vi beräknar sannolikheten från $170$ upp till $1 0^{99},$ vilket motsvarar alla värden över $170 .$

Vi gör sedan samma sak för Ärling, och då måste vi byta ut medelvärdet mot $150$ och standardavvikelsen mot $15 .$

Sannolikheten att Ängla plockar över

170

kg är alltså ungefär

0.15866

och för Ärling är den

0.09121 .

Eftersom det är oberoende händelser räcker det med att multiplicera dem för att få sannolikheten att båda plockar mer än

170

kg.

0.15866 \cdot 0.09121 = 0.01447 \dots \approx 0.014 = 1.4 %

Det är alltså ungefär

1.4 %

chans att de båda lyckas plocka mer än

170

kg äpplen samma dag.

Digitala verktyg

Normalfördelning med Geogebra

I Geogebra finns funktionen Normalfördelning() som kan användas för att göra numeriska beräkningar på normalfördelningar. Eftersom beräkningen måste ske numeriskt bör man använda classic-versionen av Geogebra. Om man skriver in ordet Normalfördelning på en tom rad dyker följande förslag upp.

Normalfördelning( <Medelvärde>, <Standardavvikelse>, <Variabelvärde> )

Det funktionen beräknar är den så kallade kumulativa sannolikheten för ett variabelvärde, t.ex.

x = b,

som är definierat som

P (x \leq b) .

Den beräknar alltså sannolikheten att

x

är mindre än eller lika med

b .

För täthetsfunktionen

f (x)

motsvarar det

P (x \leq b) = \int_{- \infty}^{b} f (x) d x .

Sannolikheten att $x$ är mindre än $2$ för en normalfördelning med medelvärde $3$ och standardavvikelsen $1$ kan alltså beräknas på följande vis.

Normalfördelning( $3, 1, 2$ )

$\to 0.16$

Denna beräkning motsvarar integralen

\int_{- \infty}^{2} \frac{1}{1 2 π} \cdot e^{- \frac{1}{2} (\frac{x - 3}{1})^{2}} d x \approx 0.16 .

Om man istället skulle få ett svar på följande form innebär det att man använde CAS-versionen av Geogebra.

Normalfördelning(3, 1, 2)

$\to \frac{e r f ( - \frac{2}{2} ) + 1}{2}$

Då kan man antingen klicka på $\approx$ -tecknet i den övre menyraden för att få en numerisk approximation, eller byta till classic-versionen av Geogebra. För att beräkna sannolikheten att ett resultat hamnar inom ett intervall, alltså $P (a \leq x \leq b),$ kan man se sannolikheten som en differens mellan två kumulativa sannolikheter.

{{ article.displayTitle }}