Logga in
Låddiagram är ett verktyg inom statistik som används för att illustrera spridningen i en datamängd. Det visar fem viktiga värden: största och minsta värde, medianen samt övre och undre kvartil. Detta diagram ger en grov uppskattning av hur spridd en datamängd är, där varje segment av diagrammet innehåller en fjärdedel av värdena. Det används ofta för att jämföra resultat mellan olika grupper, som klassresultat på ett prov. Låddiagram kan också skapas med digitala verktyg, och det finns funktioner för att beräkna kvartilavståndet, variationsbredden och andra statistiska mått. Detta verktyg är användbart för att förstå och analysera data på ett visuellt sätt, utan att behöva gå in i beräkningar.
| | 10 sidor teori |
| | 26 Uppgifter - Nivå 1 - 3 |
| | Varje lektion är menad motsvara 1-2 lektioner i klassrummet. |
I den här lektionen går vi igenom följande begrepp:
En percentil är ett värde i en datamängd som delar in materialet i olika storlekar. Man tillskriver alltid percentiler ett index mellan 1 och 99. Exempelvis är den 10:e percentilen (P_(10)) det värde som delar in materialet så att 10 % av värdena befinner sig under P_(10) och 90 % över.
Medianen delar in ett statistiskt material i två lika stora delar. Kvartiler (från ordet kvart som betyder fjärdedel) delar in ett material i fyra
lika stora delar. Kvartilerna är de tre tal som avgränsar delarna, och betecknas Q_1, Q_2 och Q_3. Exempelvis delas 12 värden in i fyra delar med 3 stycken i varje.
nya medianerför de värden som är mindre respektive större än medianen.
Kvartilavståndet är ett spridningsmått som anger avståndet mellan den undre och övre kvartilen. Man beräknar det genom att subtrahera Q_1 från Q_3.
Kvartilavstånd=Q_3-Q_1
Morgontrötta klubben har sammanställt data över hur många minuter deras medlemmar brukar snooza på morgonen.20 20 30 30 40 40 45 45 45 50
50-20=30 min.
20 20 30 30 40_(5st.) | 40 45 45 45 50_(5st.) Det femte värdet är 40 och det sjätte värdet är också 40. Medelvärdet av dessa blir 40+402=40 vilket alltså är medianen. Nu kan vi bestämma kvartilerna genom att dela halvorna på mitten. Varje halva innehåller ett udda antal värden så kvartilerna kommer vara de värden i datamängden som delar upp varje halva i två delmängder med två tal i varje. Den undre kvartilen ges av det tredje värdet och den övre kvartilen ges av det åttonde värdet. 20 20 30 30 40_(5st.) | 40 45 45 45 50_(5st.) Nu ser vi att Q_1=30 min. och Q_3=45 min.
Q_3-Q_1=45-30=15 min.
Antalet värden på eller under den 80:e percentilen är 8. Dessa värden är de första 8 i den ordnade listan: 20 20 30 30 40 40 45 45.
För att illustrera spridningen i ett statistiskt material använder man sig ibland av ett så kallat lådagram. I detta kan man läsa av medianen (skrivs Med eller Q_2), kvartiler (Q_1 och Q_3) samt största och minsta värde.
För att kunna rita ett lådagram måste man bestämma fem mått för den datamängd man vill undersöka: största och minsta värdet, medianen samt övre och undre kvartil. Nedanstående datamängd anger poängen för en klass på ett prov.8,5, 11, 16, 12,5, 11, 15,5, 12, 7, 13, 10,5, 5, 15, 8, 9, 8, 8,5, 6 , 12, 15, 15,5, 13,5, 7,5, 13, 10,5, 11,5, 13,5 Vi identifierar de fem måtten för datamängden.
För att kunna rita ett lådagram måste man känna till fem olika värden: datamängdens minsta och största värde, undre och övre kvartil samt median. Dessa kan man hitta med hjälp av en räknare.
Om man vill ta bort ett värde kan man göra det med knappen DEL.
Välj alternativet 1-Var Stats, som används för att beräkna diverse statistiska mått för en datamängd, och tryck på ENTER. Kommandot 1-Var Stats visas då på skärmen och för att köra det, tryck på ENTER en gång till. När resultatet sedan visas, tryck nedåt för att läsa av värdena minX
(minsta värde), Q_1
(undre kvartil), Med
(median), Q_3
(övre kvartil) respektive maxX
(största värde).
Använd nu dessa värden för att rita ett lådagram för hand.
Bossebageriet har gjort mätningar av temperaturen på 800 koppar cappuccino. Lådagrammet visar resultatet i ^(∘)C.
En bra cappuccino ska enligt experterna ligga mellan 55 och 60 grader. Ungefär hur många av kopparna hade denna temperatur, och vad säger lådagrammet om temperaturspridningen på de koppar som var kallare respektive varmare än så?
I varje del av lådagrammet finns 25 % av värdena. Det betyder att 50 % av värdena ligger i lådan.
Den första kvartilen ligger vid 54 grader och den tredje ligger vid 60 grader. Det betyder att ungefär 50 % av de 800 kopparna hamnade i intervallet 55-60^(∘)C: 800/2=400. Cirka 400 koppar hade alltså den önskvärda temperaturen.
Det vi kan säga om övriga koppar är att spridningen i temperatur är mycket större bland de 200 kallaste kopparna (54-39=15 ^(∘)C skillnad) än bland de 200 varmaste kopparna (5^(∘)C skillnad).
Använd det givna lådagrammet för att hitta värdet på ett mått. Måttet som ska bestämmas kan vara minimum, maximum, Q_1, medianen (Q_2), Q_3, variationsbredden eller kvartilavståndet.
Vi börjar med att skriva talen i storleksordning: 1 3 5 5 6 6 8 9 Först bestämmer vi medianen och därefter kvartilerna.
Medianen delar datamängden i två lika stora halvor med fyra tal i varje. Eftersom datamängden består av ett jämnt antal värden så är inget enskilt värde i datamängden medianen. Istället beräknas medianen som medelvärdet av det fjärde och femte värdet. 1 3 5 5_(4st.) | 6 6 8 9_(4st.) Det fjärde värdet är 5 och det femte värdet är 6. Medelvärdet av dessa blir 5+62=5,5 vilket är medianen.
När vi bestämt halvorna som medianen delar in datamängden i kan vi bestämma kvartilerna genom att dela dessa halvor på mitten. Även halvorna består av ett jämnt antal värden så kvartilerna kommer inte heller att vara några specifika värden i datamängden. 1 3_(2 st.) | 5 5_(2 st.) | 6 6_(2 st.) | 8 9_(2 st.) Den undre kvartilen är medelvärdet av värdena 3 och 5, dvs. 3+52=4. Den övre kvartilen är medelvärdet av värdena 6 och 8, alltså 6+82=7.
Vi sätter talen i storleksordning.
0 0 0 1 1 1 2 3 5 6 7
Först bestäms medianen och därefter kvartilerna.
Denna datamängd består av 11 värden, alltså ett udda antal. Det innebär att det sjätte värdet kommer att vara medianen eftersom det delar in datamängden i två lika stora halvor med 5 värden på varje sida. 0 0 0 1 1_(5st.) 1 2 3 5 6 7_(5st.) Datamängdens median är alltså 1.
Nu kan vi bestämma kvartilerna genom att dela halvorna på mitten. Varje halva innehåller ett udda antal värden så kvartilerna kommer vara de värden i datamängden som delar upp varje halva i två delmängder med två tal i varje. Den undre kvartilen ges av det tredje värdet och den övre kvartilen ges av det nionde värdet. 0 0_(2st.) 1 1_(2st.) 1 2 3_(2st.) 5 6 7_(2st.) Undre kvartilen är alltså 0 och övre kvartilen är 5.
Vi kan läsa av det minsta värdet från lådagrammet.
Det minsta värdet är 90.km /h..
Precis som i föregående deluppgift kan vi avläsa det största värdet från lådagrammet.
Det största värdet är 150.km /h..
Variationsbredden är skillnaden mellan det största och minsta värdet. De är 90.km /h. och 150.km /h., så variationsbredden blir
150-90=60 .km /h..
Medianen är mittenvärdet om talen är skrivna i storleksordning. I lådagrammet är medianen av linjen som delar lådan i två delar.
Medianen är alltså 110.
Lådans kortsidor anger kvartilerna. Första kortsidan markerar den undre kvartilen, Q_1.
Den undre kvartilen är 100.km /h..
Per samma logik som i föregående deluppgiften anger den andra kortsidan den övre kvartilen, Q_3.
Den övre kvartilen är alltså 130.km /h..
Kvartilavståndet är skillnaden mellan kvartilerna. Eftersom dessa är 100.km /h. och 130.km /h. blir det
130-100=30.km /h..
Vi börjar med att skriva talen i storleksordning: 23 26 26 28 30 31 33 38 40 Först bestämmer vi medianen och därefter kvartilerna.
Medianen delar datamängden i två lika stora delar. Eftersom datamängden består av ett nio värden kommer det femte värdet vara median. Då finns det fyra tal på varje sida. 23 26 26 28_(4st.) 30 31 33 38 40_(4st.)
Det femte värdet är 30 vilket alltså är median.
Nu kan vi bestämma kvartilerna genom bestämma medianen i varje ny datamängd. De består av fyra värden så Q_1 och Q_3 beräknas genom att bestämma medelvärdet av det andra och tredje samt sjunde och åttonde värdet. 23 26_(2st) | 26 28_(2st.) 30 31 33_(2st.) | 38 40_(2st.) Den undre kvartilen är alltså medelvärdet av 26 och 26, dvs. 26+262=26. Den övre kvartilen är medelvärdet av 33 och 38, alltså 33+382=35,5.
För att beräkna medianen och kvartilerna matar vi in värdena i räknaren genom att trycka på knappen STAT och sedan välja Edit... i menyn. Där skriver vi in datapunkterna i en av listorna, t.ex. lista L1.
När värdena är inmatade trycker vi på STAT igen och går sedan åt höger till CALC-menyn.
Vi väljer alternativet 1-Var Stats, trycker på ENTER två gånger och klickar oss nedåt i menyn till Q1
(undre kvartil), Med
(median) och Q3
(övre kvartil).
Undre kvartil är alltså 26, median är 30 och övre kvartil är 35,5, vilka är samma värden som när vi beräknade dem ovan.
Återigen sätter vi talen i storleksordning.
84 84 86 89 90 92 94 95 98 99
Först bestäms medianen och därefter kvartilerna.
Mitten på datamängden är mellan det femte och sjätte talet. Därför bestäms medianen genom att beräkna medelvärdet av de värdena. 84 84 86 89 90_(5 st) | 92 94 95 98 99_(5 st) Medianen är 90+922=91.
Nu kan vi bestämma kvartilerna genom att dela halvorna på mitten. Det tredje värdet är den undre kvartilen och det åttonde är den övre kvartilen. 84 84_(2st.) 86 89 90_(2 st) | 92 94_(2st.) 95 98 99_(5 st) Den undre kvartilen är 86 och den övre kvartilen är 95.
Vi gör på samma sätt som i föregående deluppgift för att kontrollerna medianen och kvartilerna vi bestämt.
Vi ser då att medianen är 91, och att undre och övre kvartilerna är 86 respektive 95. Precis vad vi kom fram till tidigare.
Ett statistiskt material är fördelat så att det har de minsta och största värdena 1 och 10, medianen 4 samt undre och övre kvartilerna 2 respektive 7. Rita ett lådagram som beskriver denna fördelning.
För att rita ut ett lådagram behöver man de fem värden som är givna i uppgiften: max- och minvärde, median samt övre och undre kvartilen. Vi börjar med att rita ut en tallinje och markera det största och minsta värdet för materialet, alltså 1 och 10.
Vi markerar nu medianen, 4.
Sedan markerar vi den undre och övre kvartilen, Q_1=2 och Q_3 = 7.
Till sist gör vi klart själva lådan i lådagrammet genom att sammankoppla markeringen för medianen med markeringarna för kvartilerna.
25 elever testar sin reaktionsförmåga. Resultaten i sekunder sammanställs nedan. & 0,20 0,10 0,22 0,20 0,19 & 0,14 0,09 0,06 0,21 0,19 & 0,17 0,24 0,06 0,18 0,18 & 0,10 0,08 0,22 0,14 0,14 & 0,10 0,21 0,13 0,13 0,13 Rita ett lådagram som beskriver resultatet.
För att kunna rita lådagrammet måste vi bestämma det största och minsta värdet, medianen samt den undre och övre kvartilen. Detta kan göras med räknarens verktyg för detta eller för hand, vilket vi gör här. Vi börjar med att ordna talen i storleksordning. &0,06 0,06 0,08 0,09 0,10 &0,10 0,10 0,13 0,13 0,13 &0,14 0,14 0,14 0,17 0,18 &0,18 0,19 0,19 0,20 0,20 &0,21 0,21 0,22 0,22 0,24 Nu ser vi att det minsta och största värdet är 0,06 respektive 0,24.
Medianen är det mittersta värdet och delar datamängden i två lika stora halvor. Eftersom datamängden består av 25 tal, dvs. ett udda antal tal, så kommer det trettonde talet i listan utgöra median. Vi räknar talen tills vi kommer till det trettonde. &0,06 0,06 0,08 0,09 0,10 &0,10 0,10 0,13 0,13 0,13 &0,14 0,14 0,14 0,17 0,18 &0,18 0,19 0,19 0,20 0,20 &0,21 0,21 0,22 0,22 0,24
I varje halva finns det 12 tal, dvs. ett jämnt antal, så undre kvartilen beräknas som ett medelvärde av det sjätte och sjunde talet. &0,06 0,06 0,08 0,09 0,10 & 0,10 0,10 0,13 0,13 0,13 &0,14 0,14 0,14 0,17 0,18 &0,18 0,19 0,19 0,20 0,20 &0,21 0,21 0,22 0,22 0,24 Den övre kvartilen beräknas som ett medelvärde av det nittonde och tjugonde talet: Q_1=0,10+0,10/2=0,10 Q_3=0,20+0,20/2=0,20.
Nu har vi allt som behövs för att rita ett lådagram. Rita först en tallinje där alla värden får plats.
Börja med att markera medianen, undre och övre kvartil med tre lodräta streck vid 0,14 samt 0,10 och 0,20 lite ovanför tallinjen. Skapa en låda genom att rita ett tak
och golv
på strecken. Dra sedan svansar
till minsta och största värdet 0,06 och 0,24.
Lådagrammet visar resultatet från ett stickprov. Stickprovet anger antalet timmar en person sov per natt under en period av 15 nätter.
Värdena i stickprovet nedan är angivna i storleksordning. Ett av värdena har ersatts med x. 3, 5, 6, 6, 7, 7, 7, x, 8, 8, 8, 8, 9, 9, 13 Vilket värde har x? Motivera ditt svar.
Värdet x ser ut att vara i mitten av värdena, och räknar vi dem ser vi att det finns sex värden till vänster och sex värden till höger. Det betyder att x är medianen, alltså det mittersta värdet. Det betyder att x = 7.
Svaret är alltså x = 7.
Lådagrammen visar hur två lika stora naturklasser presterade på ett engelskprov där maxpoäng var 15.
Finns det några likheter mellan klassernas resultat? Motivera ditt svar.
Jämför de två lådagrammen ser vi att endast deras övre kvartiler är vid samma värde, 7. Det betyder att för båda klasserna hade 75 % av eleverna 7 poäng eller under, vilket också kan ses som att 25 % av dem hade 7 poäng eller över.
En annan likhet som vi kan notera är att ingen av klasserna hade någon elev som fick alla rätt. Det gick alltså rätt dåligt på provet.
Under en veckas tid observerade en fågelskådare hur många domherrar som fanns i trädet utanför hans köksfönster vid frukosten. Han antecknade följande observationsvärden: 11 3 7 8 7 5 4. Rita ett lådagram som beskriver spridningen.
Vi behöver bestämma observationernas median, undre och övre kvartil samt minsta och största värde för att kunna rita lådagrammet. Här bestämmer vi dessa värden utan räknare, men det går också att göra med räknarens verktyg för detta. Vi börjar med att skriva värdena i storleksordning. 3 4 5 7 7 8 11 Vi ser att minsta värdet är 3 och största värdet 11.
Medianen är det värde som delar observationerna i två halvor, dvs. mittenvärdet. 3 4 5 7 7 8 11 I detta fall är medianen alltså 7.
Undre kvartilen är mittenvärdet för de värden som är lägre än medianen och övre kvartilen är mittenvärdet för observationerna som är högre än medianen. 3 4 5 7 7 8 11 Nedre kvartilen är därför 4 och övre kvartilen 8. Nu har vi alla värden som krävs för att rita lådagrammet.
Vi börjar med att rita en tallinje där både minsta och största värdet får plats.
Vi ritar nu in lodräta sträck ovanför tallinjen, vid 4, 7 och 8, som markerar undre kvartil, median och övre kvartil och ritar en låda med dessa. Vid minsta värdet 3 och högsta värdet 11 ritas något kortare streck ut, och till sist drar vi streck från dessa värden till lådan.
För att avgöra hur många som gav betyget tre eller högre gör vi en avläsning i lådagrammet. Vi ser att gränsen mellan första och andra delen av lådagrammet finns vid 3. Varje del av lådagrammet representerar 25 % av stickprovet, och i det här fallet ligger tre av dessa delar ovanför värdet 3, vilket då är 3 * 25 % = 75 % av stickprovet.
Stickprovet bestod av 100 personer, och 75 % av 100 är 75. Det var alltså ungefär 75 personer som gav saften betyget 3 eller högre.
Vi vill nu avgöra om företaget bör lansera SAFT3000, och vi gör det genom att undersöka hur betygen fördelar sig i lådagrammet. Mittmarkeringen, som anger medianen, sitter vid värdet 4 och delar in svaren så att hälften finns ovanför och hälften under. Det betyder att hälften av de som smakade på saften gav den betyget 4 eller lägre.
Det kan inte räknas som ett bra betyg för saften om hälften av de som testar den ger den ett så lågt betyg, så företaget bör nog tänka om sin lansering.