| {{ 'ml-lesson-number-slides' | message : article.intro.bblockCount }} |
| {{ 'ml-lesson-number-exercises' | message : article.intro.exerciseCount }} |
| {{ 'ml-lesson-time-estimation' | message }} |
Beroende på vad man undersöker kommer ett statistiskt material att fördela sig på olika sätt. En av de vanligaste fördelningarna kallas normalfördelning och kan ofta användas för att beskriva t.ex. längder och vikter. Nedan har man gjort ett histogram med uppmätta vikter av en viss typ av godispåsar med medelvärdet 112.5 g.
Ju fler observationer man gör desto mer kommer histogrammet likna en kulle med sin högsta punkt vid medelvärdet. Observationerna fördelar sig symmetriskt kring medelvärdet och bredden bestäms av standardavvikelsen. De flesta värdena hamnar nära medelvärdet och blir mer ovanliga längre ut i "svansarna." En kurva med det här utseendet kallas för normalfördelningskurva eller Gausskurva.
Allt material som är normalfördelat fördelar sig på samma sätt. Exempelvis ligger alltid ca 68.2%, alltså ungefär två tredjedelar, av observationerna inom en standardavvikelse från medelvärdet, oavsett vad medelvärdet μ och standardavvikelsen σ är.
Utseendet på själva kurvan ändras med olika värden på standardavvikelsen. Om standardavvikelsen ökar eller minskar blir kurvan bredare respektive smalare. Procentsatserna ändras dock inte – man hittar ändå samma andel av värdena i de olika intervallen och summan av dem blir alltid 100%.
Reaktionstiden för ett visst test är normalfördelad med medelvärdet 250 ms och standardavvikelsen 50 ms. Hur många av testresultaten kan man förvänta sig hamnar mellan 200 och 350 ms?
Området mellan 200 ms och 350 ms går från en standardavvikelse under medelvärdet till två standardavvikelser ovanför medelvärdet.
Födelsevikten för kattungar är normalfördelad runt medelvärdet 100 g, med standardavvikelsen 15 g. Hur stor andel av kattungarna kan man förvänta sig väger mellan 70 g och 130 g?
I denna typ av uppgifter är det bra att börja med att skissa en generell normalfördelning.
På samma sätt räknar vi även ut att μ−2σ=70 g och μ+2σ=130 g och skriver in i skissen.
Vi är intresserade av hur många kattungar som väger mellan 70 g och 130 g när de föds, så vi markerar det intervallet i normalfördelningen.