Logga in
| 10 sidor teori |
| 26 Uppgifter - Nivå 1 - 3 |
| Varje lektion är menad motsvara 1-2 lektioner i klassrummet. |
I den här lektionen går vi igenom följande begrepp:
En percentil är ett värde i en datamängd som delar in materialet i olika storlekar. Man tillskriver alltid percentiler ett index mellan 1 och 99. Exempelvis är den 10:e percentilen (P10) det värde som delar in materialet så att 10% av värdena befinner sig under P10 och 90% över.
Medianen delar in ett statistiskt material i två lika stora delar. Kvartiler (från ordet kvart som betyder fjärdedel) delar in ett material i fyra
lika stora delar. Kvartilerna är de tre tal som avgränsar delarna, och betecknas Q1,Q2 och Q3. Exempelvis delas 12 värden in i fyra delar med 3 stycken i varje.
nya medianerför de värden som är mindre respektive större än medianen.
Kvartilavståndet är ett spridningsmått som anger avståndet mellan den undre och övre kvartilen. Man beräknar det genom att subtrahera Q1 från Q3.
Kvartilavsta˚nd=Q3−Q1
För att illustrera spridningen i ett statistiskt material använder man sig ibland av ett så kallat lådagram. I detta kan man läsa av medianen (skrivs Med eller Q2), kvartiler (Q1 och Q3) samt största och minsta värde.
Medianen delar in materialet i två delar med 13 tal i varje halva. Den undre kvartilen är mittenvärdet i den första delen, dvs. den sjunde observationen som är 8,5. Den övre kvartilen beräknas genom att bestämma medianen för den övre halvan, dvs. den tjugonde observationen som är 13,5. Även kvartilerna markeras i diagrammet och slutligen ritas en låda mellan dem.
För att beräkna värdena måste man först mata in de värden man vill rita lådagrammet för i räknaren. Det gör man genom att trycka på knappen STAT och sedan välja Edit... i menyn. Där kan man sedan skriva in sina datapunkter i en av listorna, t.ex. lista L1.
Om man vill ta bort ett värde kan man göra det med knappen DEL.
När värdena är inmatade trycker man på STAT igen och går sedan åt höger till CALC-menyn.
Välj alternativet 1-Var Stats, som används för att beräkna diverse statistiska mått för en datamängd, och tryck på ENTER. Kommandot 1-Var Stats visas då på skärmen och för att köra det, tryck på ENTER en gång till. När resultatet sedan visas, tryck nedåt för att läsa av värdena minX
(minsta värde), Q1
(undre kvartil), Med
(median), Q3
(övre kvartil) respektive maxX
(största värde).
Använd nu dessa värden för att rita ett lådagram för hand.
Bossebageriet har gjort mätningar av temperaturen på 800 koppar cappuccino. Lådagrammet visar resultatet i ∘C.
En bra cappuccino ska enligt experterna ligga mellan 55 och 60 grader. Ungefär hur många av kopparna hade denna temperatur, och vad säger lådagrammet om temperaturspridningen på de koppar som var kallare respektive varmare än så?
Se lösning.
Kvartiler delar in data i fyra lika stora delar, där varje del innehåller 25% av värdena. Hur många av dessa delar omfattar den ideala temperaturen för en cappuccino? Vilken sida av diagrammet täcker ett större intervall — de kallare eller de varmare kopparna?
I varje del av lådagrammet finns 25% av värdena. Det betyder att 50% av värdena ligger i lådan.
Det vi kan säga om övriga koppar är att spridningen i temperatur är mycket större bland de 200 kallaste kopparna (54−39=15∘C skillnad) än bland de 200 varmaste kopparna (5∘C skillnad).
Använd det givna lådagrammet för att hitta värdet på ett mått. Måttet som ska bestämmas kan vara minimum, maximum, Q1, medianen (Q2), Q3, variationsbredden eller kvartilavståndet.
Hur många olika samlingar med sju heltalsvärden kan beskrivas av lådagrammet?
Vi börjar med att namnge de sju talen i samlingen i stigande ordning med bokstäver från a till g: a, b, c, d, e, f, g. Fem av dessa kan vi bestämma med hjälp av lådagrammet. Först avläser vi det minsta värdet, a, och det största värdet, g.
Vi får alltså att a = 4 och g = 12. Vi läser sedan av medianen, som är det mittersta talet i samlingen, d.
Vi får att d = 9 och vår samling värden ser för tillfället ut på följande sätt: 4, b, c, 9, e, f, 12. Medianen delar in talen i två halvor: en med tre tal ovanför och en med tre tal under. Mittentalen i delmängderna som skapas, alltså b och f, är undre respektive övre kvartilen. Båda dessa tal kan avläsas.
Vi har nu avläst allt som vi kan från lådagrammet, men det finns fortfarande två tal som vi inte har bestämt. 4, 7, c, 9, e, 10, 12. Talen är heltal skrivna i storleksordning, vilket innebär att c är 7, 8 eller 9 och e kan bara vara 9 eller 10. Det finns alltså 3 tal som kan ersätta c och 2 för e. Det ger totalt 3*2=6 möjliga kombinationer. Det finns alltså 6 möjliga samlingar.
Bröderna Andreas och Tim har under tre års tid sprungit milen regelbundet och skrivit upp sina tider. De söker sig båda till långdistanslaget för klubben LUBBA. Tyvärr har klubben endast plats för en till löpare i laget. För att huvudcoachen ska fatta ett bra beslut ber han Andreas och Tim att sammanställa sina 100 senaste lopp i lådagram.
Baserat på lådagrammen tycker coachen att Andreas verkar vara den bästa kandidaten. Han har dels sprungit snabbare i fler lopp än Tim och verkar vara en mer jämn löpare. Jag vet vad jag får med Andreas
menar coachen. Håller du med, eller går det att resonera på något annat sätt?
Desto mer man tränar, desto bättre blir man. De senaste loppen ligger alltså sannolikt mellan minsta värdet och nedre kvartilen.
Tittar vi på lådagrammen ser vi att Tim faktiskt har lyckats springa milen snabbare än Andreas. Tim har alltså varit bättre på att springa än Andreas från början men sannolikt har Andreas hunnit bli bättre än Tim under årens gång. Huvudcoachen borde alltså fundera en gång till över sitt beslut.
Vi vet att Rutger hade 40 resultat som han förde in i sin dator, men bara de första 15 är kända. Vi kan illustrera detta med 40 punkter, där de gröna är kända och de röda är okända.
Oftast när man bestämmer kvartilerna för en samling värden börjar man med att hitta medianen, men i det här fallet går inte det eftersom vi inte känner till mittenvärdet. Vi vet dock att medianen kommer att hamna i mitten av värdena och dela dem i två halvor, med 402=20 värden på varje sida.
Vi kan inte räkna ut vad medianen är men det hindrar oss inte från att fortsätta med att dela de två halvorna på mitten. Denna indelning görs av den undre och övre kvartilen och det finns 202 = 10 tal i varje del.
Vi söker den undre kvartilen. Den kommer att vara medelvärdet av det sista talet i den första fjärdedelen och första talet i andra fjärdedelen, och dessa känner Rutger till. Svaret är alltså ja, det går att räkna ut första kvartilen med den informationen Rutger har.
Edith och Piaf har ett insektspensionat. Under två veckor skriver de ner hur många insekter som kommer och äter av deras goda Puh-honung. De gör sedan en frekvenstabell som visar hur många dagar pensionatet hade ett visst antal besökare.
Antal insekter | Antal dagar |
---|---|
1 | 2 |
2 | 3 |
3 | 3 |
4 | 1 |
5 | 1 |
6 | 2 |
7 | 2 |
Rita ett lådagram som visar spridningen av antalet insekter som var på besök.
För att rita ett lådagram behöver vi bestämma minsta värde, största värde, median, nedre kvartil och övre kvartil. Detta kan vi göra antingen med räknarens verktyg för detta eller utan. Här gör vi det utan räknare. Vi börjar med att skriva ner varje enskild observation från frekvenstabellen, dvs. vi skriver ner två stycken 1:or eftersom det under två dagar kom en insekt på besök, tre stycken 2:or eftersom det under tre dagar kom två insekter på besök osv. 1 1 2 2 2 3 3 3 4 5 6 6 7 7 Dessa står redan i storleksordning så vi kan direkt se att minsta och största värde är 1 respektive 7.
Medianen är det mittersta av värdena. Vi har dock ett jämnt antal värden, 14 stycken, så medianen är då medelvärdet av de två värdena i mitten. 1 1 2 2 2 3 3 3 4 5 6 6 7 7 Medianen är därför 3+32= 62=3.
Undre kvartilen är medianen för den lägre hälften av värdena, medan den övre kvartilen istället är medianen för den högre hälften. 1 1 2 2 2 3 3 3 4 5 6 6 7 7 Ovan ser vi att mittenvärdet av de sju lägsta värdena är 2, dvs. den undre kvartilen är 2. Vi ser också att den övre kvartilen är 6.
Vi har nu bestämt alla värden som krävs för att rita ett lådagram. Vi börjar med att rita en tallinje där både minsta och största värde finns med.
Lite ovanför tallinjen markerar vi nu medianen samt kvartilerna med tre lodräta streck vid 3, 2 respektive 6. Vi ritar en låda av detta. Till sist markerar vi minsta och största värde vid 1 respektive 7 med lite kortare streck, samt drar streck från dessa värden in till lådan.
Sara ville ta reda på hur vanligt det är att man skickar SMS i hennes klass.
I klassen går det 29 elever. En dag lämnade Sara ut lappar med frågan "Hur många SMS skickade du förra veckan?" Alla i klassen utom Sara svarade på frågan.
Det lådagram som hon ritade över resultatet ser du här nedanför. Med lådagrammet delas antalet elevsvar in i fyra lika stora delar. Till exempel så finns en fjärdedel av elevsvaren mellan det minsta värdet och nedre kvartilen, se figur.
Bestäm variationsbredden. Endast svar fordras
Medelvärdet är 23 skickade SMS. Förklara vilket lägesmått (medelvärde eller median) som är lämpligast att använda om du vill beskriva hur många SMS en elev i klassen skickar under en vecka.
Här kan svaret anges utan motivering men vi visar hur man kan komma fram till det. Variationsbredden definieras som skillnaden mellan det största mätvärdet och det minsta mätvärdet. Från lådagrammet kan vi avsläsa att variationsbredden = 65- 6 = 59.
Medianen är det mest lämpliga lägesmåttet. Det motiverar vi genom att visa att medelvärdet inte alls är lämpligt. Från problemformuleringen och från lådagrammet vet vi att antal skickade SMS har
medelvärde &= 23
median &=13.
Från lådagrammet kan vi även se att den övre kvartilen är vid 22 skickade SMS. Det betyder att 75%, eller tre fjärdedelar,
av de 28 tillfrågade eleverna svarade 22 eller färre på hur många SMS de skickade förra veckan. Annorlunda uttryckt kan vi säga att att
bara sju elever skickade fler än 22 SMS,
eftersom sju elever utgör den resterande fjärdedelen.
Om vi nu jämför medelvärdet 23 SMS med den övre kvartilen 22 SMS, kan vi dra slutsatsen att de sju elever som skickade flest SMS
tillsammans skickade väldigt många, så många att medelvärdet steg till ett värde högre än vad majoriteten på 21 elever skickade.
Medelvärdet är inte lämpligt!
Medianen, med värde 13, lämpar sig å andra sidan bättre för att beskriva hur många SMS en elev skickade.
Det eftersom 13 nästan ligger i mitten av det minsta värdet 6 och övre kvartilen 22, samt att majoriteten av eleverna skickade 22
eller färre SMS.
Lådagrammet visar höjderna på berg-och-dalbanorna i en nöjespark.
Vilken bråkdel av berg-och-dalbanorna är mellan 120 meter och 220 meter höga?
Är datan mer spridd under eller över medianen? Förklara.
Hitta och tolka det interkvartila intervallet för datan.
Tänk på att det givna lådagrammet visar höjderna på berg- och dalbanorna i en nöjespark.
Vi vill hitta andelen berg- och dalbanor som är mellan 120 och 220 meter höga. För att göra det, kom ihåg att ungefär 1/4 av datan finns i varje morrhår och ungefär 1/2 finns i lådan. Eftersom intervallet från 120 till 220 meter inkluderar ett morrhår och en låda, kan vi addera bråken för var och en av dessa sektioner för att hitta bråket för intervallet.
Därför är 3/4 av berg- och dalbanorna mellan 120 meter höga och 220 meter höga.
Vi vill avgöra om datan som representeras av det givna lådagrammet är mer utspridd under eller över medianen.
Observera att morrhåren har samma storlek, vilket betyder att datan är jämnt fördelad under och över medianen.
Kom ihåg beskrivningen av interkvartilavståndet.
IQR representerar intervallet för den mittersta halvan av datan och är ett annat mått på variation.
För att hitta interkvartilavståndet (IQR) måste vi hitta skillnaden mellan den tredje kvartilen och den första kvartilen. Från det givna låd- och morrhårsdiagrammet kan vi identifiera kvartilerna.
Den första kvartilen är 140 och den tredje kvartilen är 220. Låt oss hitta skillnaden mellan dem!
Interkvartilavståndet är 80, vilket betyder att den mittersta halvan av höjderna på berg- och dalbanorna varierar med högst 80 meter.
Ett lådagram visar variabiliteten för en datauppsättning längs en tallinje. Den använder en rektangulär låda och två segment. Dessa segment kallas whiskers (morrhår).
Uppsättningen av tal som används för att rita lådagrammet kallas fem-nummer-sammanfattningen av datauppsättningen. Vart och ett av de fem talen är märkta i enlighet därmed.
Betrakta nu den givna datan. 2, 6, 4, 3, 7, 4, 6, 9, 6, 8, 5, 7 Vår vän gör ett lådagram för den givna datauppsättningen.
Från diagrammet kan vi se att det minsta värdet är 2, det största värdet är 9, medianen är 6, den första kvartilen är 4, och den tredje kvartilen är 7. För att avgöra om vår vän har rätt, kommer vi att identifiera fem-nummer-sammanfattningen av den givna datauppsättningen. Glöm inte att ordna datan från minsta till största först! Given Data Set 2,3,4,4,5,6,6,6,7,7,8,9 Arranged Data Set 2 3 4 4 5 6_(nedre halvan) | 6 6 7 7 8 9_(övre halvan) Minimum- och maximumvärdena är 2 respektive 9. Eftersom antalet värden är jämnt är medianen genomsnittet av de två mittersta värdena.
Medianen är 6. Dessutom, antalet värden i varje halva är jämnt, den första kvartilen är genomsnittet av de två mittersta värdena i den nedre halvan. Q_1: 4+ 4/2= 4 Analogt är den tredje kvartilen genomsnittet av de två mittersta värdena i den övre halvan. Q_3: 7+7/2=7 Den första kvartilen är 4 och den tredje kvartilen är 7. Vi får samma mått som vår vän. Därför har vår vän rätt.
Antalet dagar 12 vänner gick på camping under sommaren är 6, 2, 0, 10, 3, 6, 6, 4, 12, 0, 6, och 2. Gör ett lådagram för datan. Vad är intervallet för datan?
Ett lådagram visar variabiliteten för en datauppsättning längs en tallinje. Den använder en rektangulär låda och två segment. Dessa segment kallas morrhår.
Uppsättningen av tal som används för att rita lådagrammet kallas fem-nummer-sammanfattningen av datauppsättningen. Vart och ett av de fem talen är märkta i enlighet därmed.
Antag att antalet dagar som 12 vänner campade under sommaren är 6, 2, 0, 10, 3, 6, 6, 4, 12, 0, 6, och 2. Låt oss identifiera fem-nummer-sammanfattningen av den givna datauppsättningen. Glöm inte att ordna datan från minsta till största först! Given datauppsättning 0, 0, 2, 2, 3, 4, 6, 6, 6, 6, 10, 12 Ordna datauppsättning 0 0 2 2 3 4_(nedre halvan) | 6 6 6 6 10 12_(övre halvan) Minimum- och maximumvärdena är 0 respektive 12. Eftersom antalet värden är jämnt är medianen genomsnittet av de två mittersta värdena. Median: 4+ 6/2= 5 Dessutom, antalet värden i varje halva är jämnt, den första kvartilen är genomsnittet av de två mittersta värdena i den nedre halvan.
Analogt är den tredje kvartilen genomsnittet av de två mittersta värdena i den övre halvan. Q_3: 6+6/2=6 Den första kvartilen är 2 och den tredje kvartilen är 6.
Vi vill göra ett lådagram med hjälp av den erhållna informationen. Minimum:& 0 Första kvartilen:& 2 Median:& 5 Tredje kvartilen:& 6 Maximum:& 12 Nu när vi har alla mått kan vi göra vårt lådagram.
Vi vill också bestämma datans variationsbredd. För att göra det, kom ihåg att variationsbredden är skillnaden mellan det maximala och minimala värdet i datauppsättningen. I vårt fall är maximum 12 och minimum är 0. Skillnaden mellan dessa tal är 12. Därför är variationsbredden 12 dagars camping.
Lådagrammet representerar antalet liter vatten som behövs för att fylla olika typer av dunktankar som erbjuds av ett företag.
Vilken bråkdel av dunktankarna kräver minst 500 liter vatten?
Är datan mer spridd under den första kvartilen eller över den tredje kvartilen? Förklara.
Hitta och tolka det interkvartila intervallet för datan.
Tänk på att det givna lådagrammet representerar antalet liter vatten som behövs för att fylla olika typer av vattenkastedunkar som erbjuds av ett företag.
Vi vill hitta bråkdelen av vattenkastedunkarna som kräver minst 500 liter vatten. För att göra det, kom ihåg att ungefär 1/4 av datan finns i varje morrhår och ungefär 1/2 finns i lådan. Frasen minst
indikerar att varje data är större än eller lika med 500 liter vatten. Låt oss identifiera dessa sektioner i det givna diagrammet.
Intervallet som är större än eller lika med 500 liter inkluderar det högra morrhåret och 2/3 av lådan. Eftersom 1/2 av datan finns i lådan kan vi multiplicera denna bråkdel med 2/3 för att hitta mängden data i lådan som finns i intervallet som är större än eller lika med 500 liter.
Detta innebär att 2/6 av datan i lådan finns i intervallet som är större än eller lika med 500 liter. Nu kan vi lägga till detta till mängden data i morrhåret för att hitta bråkdelen av vattenkastedunkarna som kräver minst 500 liter vatten.
Därför kräver 7/12 av vattenkastedunkarna minst 500 liter vatten.
Vi vill avgöra om datan som representeras av det givna lådagrammet är mer utspridd under den första kvartilen eller över den tredje kvartilen.
Lägg märke till att längden på det högra morrhåret är längre än det vänstra morrhåret, vilket innebär att datan är snedfördelad åt höger. Kom ihåg att det högra morrhåret är segmentet mellan den tredje kvartilen och det maximala värdet. Detta innebär att datan är mer utspridd över den tredje kvartilen.
Kom ihåg beskrivningen av interkvartilavståndet.
IQR representerar intervallet för den mittersta halvan av datan och är ett annat mått på variation.
För att hitta interkvartilavståndet (IQR) måste vi hitta skillnaden mellan den tredje kvartilen och den första kvartilen. Från det givna lådagrammet kan vi identifiera kvartilerna.
Den första kvartilen är 450 och den tredje kvartilen är 600. Låt oss hitta skillnaden mellan dem!
Interkvartilavståndet är 150, vilket innebär att den mittersta halvan av vatten som behövs för varje vattenkastedunk varierar med högst 150 liter.