Logga in
| 8 sidor teori |
| 19 Uppgifter - Nivå 1 - 3 |
| Varje lektion är menad motsvara 1-2 lektioner i klassrummet. |
Minispelare aktiv
I den här lektionen går vi igenom följande begrepp:
Värden från en undersökning kan fördela sig på olika sätt – de kan t.ex. ligga centrerade runt medelvärdet eller långt ifrån det. Detta illustreras av de två mängderna nedan, som båda har medelvärdet, medianen och typvärdet 3, men där värdena i den nedre är betydligt mer utspridda.
Variationsbredd är ett spridningsmått som mäter skillnaden mellan det högsta och det lägsta värdet i datamängden.
Bestäm det största och det minsta värdet i datamängden. Subtrahera det minsta värdet från det största.
Variationsbredden är skillnaden mellan största och minsta värdet. Vi börjar med att identifiera dessa i datamängden.
Standardavvikelse är ett av de vanligare spridningsmåtten och kan något förenklat ses som den genomsnittliga skillnaden från medelvärdet. För ett stickprov betecknas den s. Ett litet värde på s innebär att mätvärdena är samlade nära medelvärdet och ett större s betyder att de är mer utspridda.
s=n−1(x1−xˉ)2+(x2−xˉ)2+…+(xn−xˉ)2
xˉ är stickprovets medelvärde, x:en med index 1, 2, 3 osv. är de enskilda mätvärdena och n är antalet mätvärden. Varje parentes står alltså för skillnaden mellan ett mätvärde och medelvärdet. I figuren visas skillnaderna −2 och 3 mellan medelvärdet xˉ och två värden x1 och x2.
För att använda formeln kan man dela upp beräkningarna i steg.
Friska fläktarhar tävlat i en femkamp där varje lagmedlem kan samla ihop mellan 0 och 5 poäng till laget. De fem lagmedlemmarna har fått följande resultat:
Använd formeln för standardavvikelsen för en datamängd.
xˉ=3
Sätt in värden
Subtrahera termer
Beräkna potens
Addera termer
Sätt in värden
Subtrahera term
Slå in på räknare
Avrunda till 1 decimal(er)
Friska fläktars medelpoäng var 3 poäng och deras standardavvikelse var 2,3 poäng. Det sista kan vi tolka som att den genomsnittliga skillnaden från medelpoängen var 2,3.
För att bestämma standardavvikelse för en datamängd med räknaren måste man först spara värdena i en lista. På räknaren trycker man på knappen STAT och därefter väljer man Edit
.
Observationerna skrivs in i någon av listorna.
När man sparat värdena trycker man på STAT igen och byter till CALC-menyn med piltangenterna. Välj därefter det första alternativet i listan, dvs. 1-Var Stats
.
Genom att trycka på ENTER igen bestämmer räknaren bl.a. standardavvikelsen för datamängden. Om man sparat värdena i någon annan lista, t.ex. L3, väljer man den genom att trycka 2nd + 3 innan man trycker på ENTER igen.
Följande applet visar stapeldiagram för två datamängder. Flytta reglaget för att undersöka datamängderna separat. Svara sedan på de givna frågorna baserat på visuella observationer.
Du har tre tal. Du adderar sedan 4 till alla tal.
Vi kallar talen x_1, x_2 och x_3 där x_1 är minst och x_3 är störst. När man adderar 4 till alla tal får man x_1+4, x_2+4 och x_3+4. Variationsbredden är det största minus det minsta talet dvs. x_3-x_1. När man har adderat 4 till alla blir den nya variationsbredden (x_3+4)-(x_1+4)=x_3+4-x_1-4=x_3-x_1. Den nya variationsbredden blir också x_3-x_1, dvs. den ändras inte.
Vi använder samma beteckningar som i deluppgift A. Vi börjar med att ta fram det gamla medelvärdet som vi kan beteckna x_g. Det finns tre tal så medelvärdet blir
x_g=x_1+x_2+x_3/3.
Vi lägger till 4 till alla och beräknar det nya medelvärdet, x_n.
Titta på bråket i högerledet. Det är ju medelvärdet av ursprungsvärdena dvs. x_g.
Det nya medelvärdet blir alltså 4 större än det gamla.
Med hjälp av de beteckningar för talen som vi använt förut ställer upp standardavvikelsen för ursprungstalen. Det finns tre tal så nämnaren blir 3-1=2:
s_g=sqrt((x_1-x_g)^2+(x_2-x_g)^2+(x_3-x_g)^2/2).
I den nya standardavvikelsen ökar alla mätvärden med 4, men det gör också medelvärdet. Vi måste alltså komma ihåg att använda det nya medelvärdet x_n=x_g+4.
Detta är ju samma uttryck för standardavvikelsen vi hade från början. Den ändras alltså inte.
Medelvärdet ökade med 4. Det är ganska rimligt eftersom alla värden förskjuts 4 steg till höger på en tallinje. Men eftersom alla värden förskjuts lika mycket sprider de ut sig på samma sätt och därför bör spridningsmåtten variationsbredd och standardavvikelse inte förändras.
I en fabrik med 2000 anställda vill man minska produktionstiden för en viss produkt. Medeltiden är i dagsläget 37 min. Man tror att den kommer att minska om personalen får bättre villkor. Man låter därför hälften av de anställda få en halvtimme extra rast varje dag och hälften sluta en halvtimme tidigare till samma lön. I en uppföljande stickprovsundersökning efter en tid fick man följande resultat för tillverkningstid/enhet.
Tid/enhet (min) | |
---|---|
Extra rast | 32,33,28,30 |
Sluta tidigare | 21,30,24,31 |
Det är möjligt att räkna ut medelvärde och standardavvikelserna med räknarens inbyggda verktyg för detta, här nedan gör vi det dock utan detta verktyg. Vi börjar med de som fick extra rast.
Medelvärdet var 30,75. Vi sätter nu in värdena i formeln för standardavvikelse, och börjar med täljaren.
Nu slutför vi beräkningen genom att sätta in 14,75 i täljaren i formeln.
Medelvärdet var alltså 30,75 minuter och standardavvikelsen ca 2,2 min för de som fick extra rast.
Vi gör på motsvarande sätt för stickprovet där man fick sluta tidigare.
Vi sätter nu in 26,5 i täljaren för formeln för standardavvikelse.
Vi sätter in 69 i täljaren i formeln.
De som fick sluta tidigare tillverkade en enhet på i snitt 26,5 min med en standardavvikelse på 4,8 min.
Vi börjar med medelvärdet.
Vi sätter in medelvärdet och datapunkterna i formelns täljare och förenklar.
Nu sätter vi in 46 och antal värden som är 5 st.
Standardavvikelsen är ungefär 3,4.
Vi har redan beräknat medelvärdet till x=6. Vi sätter in det tillsammans med värdena i Ragnars formel.
Enligt Ragnars metod är spridningen 0.
Eftersom man i formeln för standardavvikelse tar skillnaderna (x-x) i kvadrat blir de alltid positiva, så när de adderas adderar vi endast positiva tal. Exempelvis om medelvärdet är 6 summeras skillnaderna från värdena 4 och 8 som
(-2)^2+2^2=4+4=8.
I Ragnars metod adderar vi både positiva och negativa skillnader, vilket innebär att summan av samma avvikelser kommer att bli
-2+2=0,
vilket gör att det felaktigt ser ut som att talen 4 och 8 inte avviker från medelvärdet. Det gör att metoden är oanvändbar för att beräkna spridning.
Katthemmet Glada Tassen har ett antal rum med 7 katter i varje. I ett rum gäller att:
Variationsbredden för båda rummen är skillnaden mellan den äldsta och den yngsta kattens åldrar för alla fjorton katter. För att maximera skillnaden vill vi att katterna i det ena rummet ska vara så gamla som möjligt och katterna i det andra rummet så unga som möjligt.
Medianen måste vara 5, och om vi vill att katternas ska vara så gamla som möjligt får ingen vara yngre än så. Därför låter vi fyra av katterna, alltså de som hamnar under medianen, vara 5 år gamla. Eftersom variationsbredden i rummet ska vara 6 år måste då den äldsta katten bli 5+6=11 år.
Det spelar ingen roll vad de två sista åldrarna är, så länge de ligger mellan 5 och 11.
Mediankatten
är fortfarande 5 år i det här rummet. För att minimera åldrarna skulle vi vilja att de fyra äldsta katterna är 5 år gamla. Men då kan variationsbredden inte bli 6 år eftersom minst en katt då skulle behöva vara -1 år. Därför låter vi den yngsta katten vara 0 år och den äldsta 6.
Det spelar ingen roll hur gamla de övriga katterna är.
Den äldsta möjliga katten kan alltså vara 11 år och yngsta möjliga 0 år. För katterna i båda rummen blir då den totala variationsbredden 11-0=11 år.
Det enda man har fått reda på är de maximala bredbandshastigheterna. Man vet ingenting om deras lägsta hastighet. Låt säga att att INTERNET2000 har en minimihastighet på 25 Mbit/s, medan SURFA har minst 90 Mbit/s. Då varierar SURFA mellan 90 och 100 Mbit/s medan INTERNET2000 varierar mellan 25 och 125 Mbit/s.
Då har INTERNET2000 betydligt större spridning medan SURFA har betydligt mindre. Detta betyder att det är väldigt svårt att avgöra vem som har snabbast internet, eftersom vi inte känner till någonting om variationsbredden, utan endast det maximala värdet för leverantörerna.
Vi vill hitta variationsbredden för åldrarna på personer som står i kö för en berg- och dalbana
Åldrar | |||
---|---|---|---|
15 | 17 | 21 | 32 |
41 | 30 | 25 | 52 |
16 | 39 | 11 | 24 |
Variationsbredden för ett dataset är ett av måtten på variation.
Variationsbredd |- Variationsbredden för ett dataset är skillnaden mellan det största värdet och det minsta värdet.
Låt oss börja med att ordna åldrarna från lägsta till högsta. 11,15,16,17,21,24,25,30,32,39,41, 52 Det minsta värdet i datasetet är det första värdet, 11. Det största värdet i datasetet är det sista värdet, 52. Låt oss hitta variationsbredden genom att subtrahera det minsta värdet från det största värdet. 52 - 11 = 41 Variationsbredden för åldrarna är 41. Detta betyder att åldrarna varierar med högst 41 år.