Logga in
| 4 sidor teori |
| 20 Uppgifter - Nivå 1 - 3 |
| Varje lektion är menad motsvara 1-2 lektioner i klassrummet. |
Beroende på vad man undersöker kommer ett statistiskt material att fördela sig på olika sätt. En av de vanligaste fördelningarna kallas normalfördelning och kan ofta användas för att beskriva t.ex. längder och vikter. Nedan har man gjort ett histogram med uppmätta vikter av en viss typ av godispåsar med medelvärdet 112.5 g.
Ju fler observationer man gör desto mer kommer histogrammet likna en kulle med sin högsta punkt vid medelvärdet. Observationerna fördelar sig symmetriskt kring medelvärdet och bredden bestäms av standardavvikelsen. De flesta värdena hamnar nära medelvärdet och blir mer ovanliga längre ut i "svansarna." En kurva med det här utseendet kallas för normalfördelningskurva eller Gausskurva.
Allt material som är normalfördelat fördelar sig på samma sätt. Exempelvis ligger alltid ca 68.2%, alltså ungefär två tredjedelar, av observationerna inom en standardavvikelse från medelvärdet, oavsett vad medelvärdet μ och standardavvikelsen σ är.
Utseendet på själva kurvan ändras med olika värden på standardavvikelsen. Om standardavvikelsen ökar eller minskar blir kurvan bredare respektive smalare. Procentsatserna ändras dock inte – man hittar ändå samma andel av värdena i de olika intervallen och summan av dem blir alltid 100%.
Reaktionstiden för ett visst test är normalfördelad med medelvärdet 250 ms och standardavvikelsen 50 ms. Hur många av testresultaten kan man förvänta sig hamnar mellan 200 och 350 ms?
Området mellan 200 ms och 350 ms går från en standardavvikelse under medelvärdet till två standardavvikelser ovanför medelvärdet.
Födelsevikten för kattungar är normalfördelad runt medelvärdet 100 g, med standardavvikelsen 15 g. Hur stor andel av kattungarna kan man förvänta sig väger mellan 70 g och 130 g?
I denna typ av uppgifter är det bra att börja med att skissa en generell normalfördelning.
På samma sätt räknar vi även ut att μ−2σ=70 g och μ+2σ=130 g och skriver in i skissen.
Vi är intresserade av hur många kattungar som väger mellan 70 g och 130 g när de föds, så vi markerar det intervallet i normalfördelningen.
Vi börjar med att titta på standardintervallen för ett normalfördelat material, där andelen av materialet som finns inom vissa givna intervall är känd.
Eftersom vi känner till standardavvikelsen, σ = 4, och medelvärdet, μ = 27, kan vi bestämma alla intervall: μ + σ = 27 + 4 = 31, μ - σ = 27 - 4 = 23, μ + 2σ = 27 + 2 * 4 = 35, μ - 2σ = 27 - 2 * 4 = 19. Vi sätter in värdena i figuren.
Det sökta intervallet utgöra 47.7 % av fördelningen, vilket innebär att ett av 34.1 %-intervallen måste ingå. De andra intervallen är för små för att komma upp i en så hög andel, även om man lägger ihop dem. Lägger vi till det näst största intervallet får vi 34.1 % + 13.6 % = 47.7 %, precis det vi var ute efter. Men det finns två sätt att skapa ett sådant intervall, antingen från 19 till 27 eller från 27 till 35.
Carl är alltså antingen ute efter intervallet 19-27 kg eller 27-35 kg.
Sannolikheten 68 % anger ett område som ligger ca ± 1 standardavvikelse från medelvärdet.
Det är alltså 2 standardavvikelser mellan vikten 24.99 och 25.01 kg. Det innebär att en standardavvikelse är hälften av skillnaden mellan dessa värden. Eftersom vi ska svara i gram omvandlar vi till det genom att först multiplicera de givna vikterna med 1000. Därefter beräknar vi standardavvikelsen: σ=25 010-24 990/2=20/2=10 g. Standardavvikelsen är alltså 10 g.
Vi skissar upp en normalfördelningskurva. Vi vet att värdet 163 slag/min hamnar på μ-2σ, eftersom det är 2.3 % som har lägre puls än så. Vi vet också att 196 slag/min ligger en standardavvikelse över medelvärdet, eftersom 13.6 %+2.3 %=15.9 % är summan av de observationer som ligger i de översta två intervallen.
Nu kan vi beräkna standardavvikelsen eftersom vi vet att det är 3 intervall, och därför 3σ, från 163 till 196 slag/min. Vi tar skillnaden och delar i tre lika stora delar: σ= 196-163/3=33/3=11 slag/min. Medelvärdet beräknar vi genom att dra ifrån en standardavvikelse från 196, vilket är 196-11=185 slag/min.
Den genomsnittliga maxpulsen för en 35-åring är alltså 185 slag i minuten.
Mellan längderna 275 mm och 281 mm är det 281-275=6 mm. Genom att dela 6 med 2 (dvs. en standardavvikelse) beräknar vi antalet standardavvikelser som skiljer dessa längder åt: 6/2=3 standardavvikelser. Det finns två områden i en normalfördelning som omfattar ungefär 82 % av observationerna och skiljer sig 3 standardavvikelser åt.
Antingen ligger 275 mm en eller två standardavvikelser under medelvärdet. Medelvärdet för ljusens längder kan alltså vara något av dessa fall: &Fall 1: 275+2=277 mm. [0.5em] &Fall 2: 275+2+2=279 mm.
Ett företag som tillverkar müsli väger 1000 förpackningar i en undersökning. Vikten visar sig vara normalfördelad runt medelvärdet 380 gram med en standardavvikelse på 20 g.
Vi börjar med att undersöka endast vad som händer med medelvärdet för müslipaketen. Det ökar till 400 g, vilket får hela normalfördelningen skifta åt höger så att det nya medelvärdet hamnar en standardavvikelse över det gamla, som den gröna kurvan.
Nu lägger vi till att även standardavvikelsen förändras, den halveras från 20 g till 10 g. Då samlas observationerna tätare runt medelvärdet vilket gör att normalfördelningskurvan smalnar av och blir toppigare. Det får nu plats två nya standardavvikelser på en gammal.
Sammantaget har kurvan alltså förskjutits åt höger och blivit smalare men högre.
Maria ska lära ut hur normalfördelningar funkar och mäter därför längden på skolans elever. Hon sammanställer resultatet i två diagram, ett som beskriver killars längd och ett som beskriver tjejers.
Vi börjar med att titta på medelvärdet och ser att killarnas medellängd är 178 cm medan tjejernas medellängd är 165 cm. Genom att subtrahera medelvärdet i respektive normalfördelning från värdet som ligger en standardavvikelse ovanför kan vi bestämma hur stor denna standardavvikelse är för respektive kön: Killar:& 188-178=10 cm 0.5em] Tjejer:& 174-165=9 cm Killarna har en standardavvikelse på 10 cm och tjejernas standardavvikelse är 9 cm. Killarna är alltså längre i medel men har också större variation i sina längder.
Vi går först igenom sannolikheterna för Torvald och Tindra separat.
Vi söker sannolikheten att Torvald är kortare än 188 cm. Han ska alltså ingå i de observationer som ligger nedanför 188 cm dvs. de som är ligger 1 standardavvikelse till höger om medelvärdet och under. Vi markerar dessa i normalfördelningskurvan som beskriver killarnas längd.
Sannolikheten att en slumpmässigt vald kille är kortare än 188 cm är summan av de markerade procentsatserna i figuren: 2.3 %+13.6 % +34.1 %+34.1 %=84.1 %.
För Tindra söker vi istället sannolikheten att hon är längre än 174 cm, dvs. hon ska ingå i de observationer som ligger ovanför 174 cm, vilket är 1 standardavvikelse över medelvärdet och uppåt. Vi markerar detta intervall i normalfördelningskurvan som beskriver tjejernas längd.
Sannolikheten att en slumpmässigt vald tjej är längre än 174 cm är summan av procentsatserna i figuren: 13.6 % +2.3 %=15.9 %.
När vi nu vet sannolikheterna för de två händelserna på egen hand kan vi beräkna sannolikheten för att Torvald är kortare än 188 cm och Tindra är längre än 174 cm. Vi multiplicerar då de två sannolikheterna med varandra: P=0.841* 0.159≈ 0.13 Sannolikheten att Torvald är kortare än 188 cm och att Tindra är längre än 174 cm är alltså ca 13 %.
Ett företag fyller konservburkar med krossade tomater. Enligt märkningen innehåller en burk 400 g tomater. Tomaternas vikt är normalfördelad kring medelvärdet 395 g och standardavvikelsen är 5.0 g.
Hur många procent av konservburkarna kan förväntas innehålla mindre än de 400 g som anges på burken?
Företaget vill inte ha för många missnöjda kunder och tänker därför fylla konservburkarna lite mer. De ändrar kravet till att minst 97.7% av burkarna ska innehålla minst 400 g tomater. Standardavvikelsen antas fortfarande vara 5.0 g. Beräkna vilket medelvärde på vikten som motsvarar detta nya krav.
Vi börjar med att rita en normalfördelning som beskriver burkarna. Med medelvärdet μ = 395 och standardavvikelsen σ = 5 kan vi räkna ut markeringarna på x-axeln som μ - 2σ &= 395 - 2 * 5 = 385, μ - σ &= 395 - 5 = 390, μ + σ &= 395 + 5 = 395, μ + 2σ &= 395 + 2 * 5 = 395. Vi vill avgöra hur stor andel av burkarna som har mindre än 400 g, så vi markerar intervallet från 400 och neråt.
Genom att addera sannolikheterna i det markerade området kan vi bestämma andelen till 2.3 %+13.6 %+34.1 %+34.1 %=84.1 %. Enligt beräkningen kan man alltså förvänta sig att 84.1 % av burkarna innehåller mindre än 400 g tomater.
Om 97.7 % av burkarna ska ha minst 400 g tomater får högst 100 %-97.7 % =2.3 % av burkarna innehålla mindre än 400 g. Intervallet två standardavvikelser till vänster om medelvärdet och neråt är 2.3 % av fördelningen, så 400 ska stå längst till höger i det intervallet.
Medelvärdet ligger alltså två standardavvikelser höger om 400 i normalfördelningskurvan, dvs. vid 400+5+5=410 g.
Carl Friedrich har samlat in en stor mängd data om medellivslängden i en viss stad i Tyskland. Han antar att åldrarna är normalfördelade, så han gör ett antal beräkningar och skissar upp en modell.
Carl Friedrich visar figuren för sin vän John Tukey och förklarar hur han har tänkt. John tittar igenom siffrorna i figuren och kommer fram till att de stämmer, men han säger ändå att Carl Friedrich har tänkt fel.
Hur har Carl Friedrich tänkt fel?
Med hjälp av de värden du känner till, hjälp Carl Friedrich att visualisera sin data på något annat sätt.
Det finns flera saker i figuren som tyder på att materialet inte är normalfördelat:
Vi vet att siffrorna från figuren stämmer, så vi har följande information:
Vi vet inte hur fördelningen ser ut mellan dessa värden, men vi kan rita ett lådagram som ger en korrekt representation av datamängden.