Spridningsmått: Variationsbredd och stickprov

Du har tre tal. Du adderar sedan 4 till alla tal.

Vad händer med variationsbredden?

Vad händer med medelvärdet?

Vad händer med standardavvikelsen?

Vi kallar talen x_1, x_2 och x_3 där x_1 är minst och x_3 är störst. När man adderar 4 till alla tal får man x_1+4, x_2+4 och x_3+4. Variationsbredden är det största minus det minsta talet dvs. x_3-x_1. När man har adderat 4 till alla blir den nya variationsbredden (x_3+4)-(x_1+4)=x_3+4-x_1-4=x_3-x_1. Den nya variationsbredden blir också x_3-x_1, dvs. den ändras inte.

Vi använder samma beteckningar som i deluppgift A. Vi börjar med att ta fram det gamla medelvärdet som vi kan beteckna x_g. Det finns tre tal så medelvärdet blir x_g=x_1+x_2+x_3/3. Vi lägger till 4 till alla och beräknar det nya medelvärdet, x_n.

Titta på bråket i högerledet. Det är ju medelvärdet av ursprungsvärdena dvs. x_g.

Det nya medelvärdet blir alltså 4 större än det gamla.

Med hjälp av de beteckningar för talen som vi använt förut ställer upp standardavvikelsen för ursprungstalen. Det finns tre tal så nämnaren blir 3-1=2: s_g=sqrt((x_1-x_g)^2+(x_2-x_g)^2+(x_3-x_g)^2/2). I den nya standardavvikelsen ökar alla mätvärden med 4, men det gör också medelvärdet. Vi måste alltså komma ihåg att använda det nya medelvärdet x_n=x_g+4.

Detta är ju samma uttryck för standardavvikelsen vi hade från början. Den ändras alltså inte.

Medelvärdet ökade med 4. Det är ganska rimligt eftersom alla värden förskjuts 4 steg till höger på en tallinje. Men eftersom alla värden förskjuts lika mycket sprider de ut sig på samma sätt och därför bör spridningsmåtten variationsbredd och standardavvikelse inte förändras.

I en fabrik med 2000 anställda vill man minska produktionstiden för en viss produkt. Medeltiden är i dagsläget 37 min. Man tror att den kommer att minska om personalen får bättre villkor. Man låter därför hälften av de anställda få en halvtimme extra rast varje dag och hälften sluta en halvtimme tidigare till samma lön. I en uppföljande stickprovsundersökning efter en tid fick man följande resultat för tillverkningstid/enhet.

	Tid/enhet (min)
Extra rast	32, 33, 28, 30
Sluta tidigare	21, 30, 24, 31

Beräkna medelvärde och standardavvikelse för de som fick extra rast, antingen utan eller med räknarens inbyggda statistikverktyg.

Beräkna medelvärde och standardavvikelse för de som fick sluta tidigare, antingen utan eller med räknarens inbyggda statistikverktyg.

Det är möjligt att räkna ut medelvärde och standardavvikelserna med räknarens inbyggda verktyg för detta, här nedan gör vi det dock utan detta verktyg. Vi börjar med de som fick extra rast.

Medelvärdet var 30,75. Vi sätter nu in värdena i formeln för standardavvikelse, och börjar med täljaren.

Nu slutför vi beräkningen genom att sätta in 14,75 i täljaren i formeln.

Medelvärdet var alltså 30,75 minuter och standardavvikelsen ca 2,2 min för de som fick extra rast.

Vi gör på motsvarande sätt för stickprovet där man fick sluta tidigare.

Vi sätter nu in 26,5 i täljaren för formeln för standardavvikelse.

Vi sätter in 69 i täljaren i formeln.

De som fick sluta tidigare tillverkade en enhet på i snitt 26,5 min med en standardavvikelse på 4,8 min.

Ragnar har kommit på ett alternativt sätt att beräkna spridning. Han beräknar skillnaden till medelvärdet, och sedan tar han medelvärdet av skillnaderna: Spridning=(x_1-x)+(x_2-x)+ ... +(x_n-x)/n. Han frågar sina kompisar vad de tror om hans idé. De svarar på en skala mellan 1 och 10 och han får följande resultat: 6, 1, 10, 8, 5.

Beräkna standardavvikelsen för värdena. Avrunda till en decimal.

Beräkna spridningen med Ragnars metod.

Jämför metoderna. Är Ragnars metod användbar?

Vi börjar med medelvärdet.

Vi sätter in medelvärdet och datapunkterna i formelns täljare och förenklar.

Nu sätter vi in 46 och antal värden som är 5 st.

Standardavvikelsen är ungefär 3,4.

Vi har redan beräknat medelvärdet till x=6. Vi sätter in det tillsammans med värdena i Ragnars formel.

Enligt Ragnars metod är spridningen 0.

Eftersom man i formeln för standardavvikelse tar skillnaderna (x-x) i kvadrat blir de alltid positiva, så när de adderas adderar vi endast positiva tal. Exempelvis om medelvärdet är 6 summeras skillnaderna från värdena 4 och 8 som (-2)^2+2^2=4+4=8. I Ragnars metod adderar vi både positiva och negativa skillnader, vilket innebär att summan av samma avvikelser kommer att bli -2+2=0, vilket gör att det felaktigt ser ut som att talen 4 och 8 inte avviker från medelvärdet. Det gör att metoden är oanvändbar för att beräkna spridning.

Katthemmet Glada Tassen har ett antal rum med 7 katter i varje. I ett rum gäller att:

katternas medianålder är 5 år,
variationsbredden för deras åldrar är 6 år.

När man undersöker åldrarna i ett annat rum på hemmet kommer man fram till att exakt samma sak gäller även där. Hur stor kan variationsbredden för alla fjorton katters åldrar vara som mest?

Variationsbredden för båda rummen är skillnaden mellan den äldsta och den yngsta kattens åldrar för alla fjorton katter. För att maximera skillnaden vill vi att katterna i det ena rummet ska vara så gamla som möjligt och katterna i det andra rummet så unga som möjligt.

Äldsta möjliga rum

Medianen måste vara 5, och om vi vill att katternas ska vara så gamla som möjligt får ingen vara yngre än så. Därför låter vi fyra av katterna, alltså de som hamnar under medianen, vara 5 år gamla. Eftersom variationsbredden i rummet ska vara 6 år måste då den äldsta katten bli 5+6=11 år.

Det spelar ingen roll vad de två sista åldrarna är, så länge de ligger mellan 5 och 11.

Yngsta möjliga rum

Mediankatten är fortfarande 5 år i det här rummet. För att minimera åldrarna skulle vi vilja att de fyra äldsta katterna är 5 år gamla. Men då kan variationsbredden inte bli 6 år eftersom minst en katt då skulle behöva vara -1 år. Därför låter vi den yngsta katten vara 0 år och den äldsta 6.

Det spelar ingen roll hur gamla de övriga katterna är.

Total variationsbredd

Den äldsta möjliga katten kan alltså vara 11 år och yngsta möjliga 0 år. För katterna i båda rummen blir då den totala variationsbredden 11-0=11 år.

Laban och Linda har olika internetleverantörer. Labans leverantör INTERNET2000 säger att hastigheten är upp till 125 Mbit/s och SURFA, Lindas leverantör, har en hastighet som är upp till 100 Mbit/s. Laban säger att hans Internet är snabbare. Stämmer det?

Det enda man har fått reda på är de maximala bredbandshastigheterna. Man vet ingenting om deras lägsta hastighet. Låt säga att att INTERNET2000 har en minimihastighet på 25 Mbit/s, medan SURFA har minst 90 Mbit/s. Då varierar SURFA mellan 90 och 100 Mbit/s medan INTERNET2000 varierar mellan 25 och 125 Mbit/s.

Då har INTERNET2000 betydligt större spridning medan SURFA har betydligt mindre. Detta betyder att det är väldigt svårt att avgöra vem som har snabbast internet, eftersom vi inte känner till någonting om variationsbredden, utan endast det maximala värdet för leverantörerna.

Åldrarna på personer i kö till en berg-och-dalbana är 15, 17, 21, 32, 41, 30, 25, 52, 16, 39, 11, och 24. Hitta och tolka intervallet för åldrarna.

Vi vill hitta variationsbredden för åldrarna på personer som står i kö för en berg- och dalbana

Åldrar
15	17	21	32
41	30	25	52
16	39	11	24

Variationsbredden för ett dataset är ett av måtten på variation.

Variationsbredd |- Variationsbredden för ett dataset är skillnaden mellan det största värdet och det minsta värdet.

Låt oss börja med att ordna åldrarna från lägsta till högsta. 11,15,16,17,21,24,25,30,32,39,41, 52 Det minsta värdet i datasetet är det första värdet, 11. Det största värdet i datasetet är det sista värdet, 52. Låt oss hitta variationsbredden genom att subtrahera det minsta värdet från det största värdet. 52 - 11 = 41 Variationsbredden för åldrarna är 41. Detta betyder att åldrarna varierar med högst 41 år.

Spridningsmått

Mathleaks

Förkunskaper