Logga in
| 6 sidor teori |
| 17 Uppgifter - Nivå 1 - 3 |
| Varje lektion är menad motsvara 1-2 lektioner i klassrummet. |
Minispelare aktiv
Värden från en undersökning kan fördela sig på olika sätt – de kan t.ex. ligga centrerade runt medelvärdet eller långt ifrån det. Detta illustreras av de två mängderna nedan, som båda har medelvärdet, medianen och typvärdet 3, men där värdena i den nedre är betydligt mer utspridda.
Variationsbredd är ett spridningsmått som mäter skillnaden mellan det högsta och det lägsta värdet i datamängden.
I den här lektionen går vi igenom följande begrepp:
Medelvärdet, eller genomsnittet, av en numerisk datamängd är ett av centralmåtten. Det definieras som summan av alla datavärden i en mängd dividerat med antalet värden i mängden.
Medelva¨rde=Antal va¨rdenSumman av va¨rden
En lärare ska ställa några frågor till sin lågstadieklass. Vilket eller vilka lägesmått är lämpligast för att presentera resultatet?
Lägesmått som medelvärde och median fungerar bra för att hitta ett värde som är representativt för en hel samling mätvärden. De säger dock inget om hur mätvärden är spridda kring detta värde. Alla ligger kanske nära medelvärdet eller så kan de vara väldigt utspridda. För att beskriva spridningen använder man spridningsmått, t.ex. variationsbredd.
Variationsbredd=Sto¨rsta va¨rde−Minsta va¨rde
Tänk på skillnaden mellan det största och det minsta värdet i en datamängd.
Variationsbredden är skillnaden mellan största och minsta värdet. Vi börjar med att identifiera dessa i datamängden.
Standardavvikelse är ett av de vanligare spridningsmåtten och kan något förenklat ses som den genomsnittliga skillnaden från medelvärdet. För ett stickprov betecknas den s. Ett litet värde på s innebär att mätvärdena är samlade nära medelvärdet och ett större s betyder att de är mer utspridda.
s=n−1(x1−xˉ)2+(x2−xˉ)2+…+(xn−xˉ)2
xˉ är stickprovets medelvärde, x:en med index 1,2,3 osv. är de enskilda mätvärdena och n är antalet mätvärden. Varje parentes står alltså för skillnaden mellan ett mätvärde och medelvärdet. I figuren visas skillnaderna −2 och 3 mellan medelvärdet xˉ och två värden x1 och x2.
För att använda formeln kan man dela upp beräkningarna i steg.
xˉ=3
Sätt in värden
Subtrahera termer
Beräkna potens
Addera termer
Sätt in värden
Subtrahera term
Slå in på räknare
Avrunda till 1 decimal(er)
Friska fläktars medelpoäng var 3 poäng och deras standardavvikelse var 2.3 poäng. Det sista kan vi tolka som att den genomsnittliga skillnaden från medelpoängen var 2.3.
För att bestämma standardavvikelse för en datamängd med räknaren måste man först spara värdena i en lista. På räknaren trycker man på knappen STAT och därefter väljer man Edit.
Observationerna skrivs in i någon av listorna.
När man sparat värdena trycker man på STAT igen och byter till CALC-menyn med piltangenterna. Välj därefter det första alternativet i listan, dvs. 1-Var Stats.
Genom att trycka på ENTER igen bestämmer räknaren bl.a. standardavvikelsen för datamängden. Om man sparat värdena i någon annan lista, t.ex. L3, väljer man den genom att trycka 2nd + 3 innan man trycker på ENTER igen.
Här kommer vi se hur standardavvikelsen kan bestämmas genom att använda formeln för standardavvikelse. Det är dock också möjligt att använda räknarens verktyg för att beräkna standardavvikelse. Men som sagt, här gör vi det för hand och börjar då med att beräkna medelvärdet av sedlarnas vikt.
Medelvärdet är alltså 0.8 g. Vi sätter in det i formeln för standardavvikelse.
Standardavvikelsen är alltså 0.043 g. Medelvärdet blir rätt, men standardavvikelsen är lite för stor, så maskinen är inte tillräckligt bra.
Du har tre tal. Du adderar sedan 4 till alla tal.
Vi kallar talen x_1, x_2 och x_3 där x_1 är minst och x_3 är störst. När man adderar 4 till alla tal får man x_1+4, x_2+4 och x_3+4. Variationsbredden är det största minus det minsta talet dvs. x_3-x_1. När man har adderat 4 till alla blir den nya variationsbredden (x_3+4)-(x_1+4)=x_3+4-x_1-4=x_3-x_1. Den nya variationsbredden blir också x_3-x_1, dvs. den ändras inte.
Vi använder samma beteckningar som i deluppgift A. Vi börjar med att ta fram det gamla medelvärdet som vi kan beteckna x_g. Det finns tre tal så medelvärdet blir
x_g=x_1+x_2+x_3/3.
Vi lägger till 4 till alla och beräknar det nya medelvärdet, x_n.
Titta på bråket i högerledet. Det är ju medelvärdet av ursprungsvärdena dvs. x_g.
Det nya medelvärdet blir alltså 4 större än det gamla.
Med hjälp av de beteckningar för talen som vi använt förut ställer upp standardavvikelsen för ursprungstalen. Det finns tre tal så nämnaren blir 3-1=2:
s_g=sqrt((x_1-x_g)^2+(x_2-x_g)^2+(x_3-x_g)^2/2).
I den nya standardavvikelsen ökar alla mätvärden med 4, men det gör också medelvärdet. Vi måste alltså komma ihåg att använda det nya medelvärdet x_n=x_g+4.
Detta är ju samma uttryck för standardavvikelsen vi hade från början. Den ändras alltså inte.
Medelvärdet ökade med 4. Det är ganska rimligt eftersom alla värden förskjuts 4 steg till höger på en tallinje. Men eftersom alla värden förskjuts lika mycket sprider de ut sig på samma sätt och därför bör spridningsmåtten variationsbredd och standardavvikelse inte förändras.
I en fabrik med 2000 anställda vill man minska produktionstiden för en viss produkt. Medeltiden är i dagsläget 37 min. Man tror att den kommer att minska om personalen får bättre villkor. Man låter därför hälften av de anställda få en halvtimme extra rast varje dag och hälften sluta en halvtimme tidigare till samma lön. I en uppföljande stickprovsundersökning efter en tid fick man följande resultat för tillverkningstid/enhet.
Tid/enhet (min) | |
---|---|
Extra rast | 32,33,28,30 |
Sluta tidigare | 21,30,24,31 |
Beräkna medelvärde och standardavvikelse för de som fick sluta tidigare, antingen utan eller med räknarens inbyggda statistikverktyg.
Det är möjligt att räkna ut medelvärde och standardavvikelserna med räknarens inbyggda verktyg för detta, här nedan gör vi det dock utan detta verktyg. Vi börjar med de som fick extra rast.
Medelvärdet var 30.75. Vi sätter nu in värdena i formeln för standardavvikelse, och börjar med täljaren.
Nu slutför vi beräkningen genom att sätta in 14.75 i täljaren i formeln.
Medelvärdet var alltså 30.75 minuter och standardavvikelsen ca 2.2 min för de som fick extra rast.
Vi gör på motsvarande sätt för stickprovet där man fick sluta tidigare.
Vi sätter nu in 26.5 i täljaren för formeln för standardavvikelse.
Vi sätter in 69 i täljaren i formeln.
De som fick sluta tidigare tillverkade en enhet på i snitt 26.5 min med en standardavvikelse på 4.8 min.
Vi börjar med medelvärdet.
Vi sätter in medelvärdet och datapunkterna i formelns täljare och förenklar.
Nu sätter vi in 46 och antal värden som är 5 st.
Standardavvikelsen är ungefär 3.4.
Vi har redan beräknat medelvärdet till x=6. Vi sätter in det tillsammans med värdena i Ragnars formel.
Enligt Ragnars metod är spridningen 0.
Eftersom man i formeln för standardavvikelse tar skillnaderna (x-x) i kvadrat blir de alltid positiva, så när de adderas adderar vi endast positiva tal. Exempelvis om medelvärdet är 6 summeras skillnaderna från värdena 4 och 8 som
(-2)^2+2^2=4+4=8.
I Ragnars metod adderar vi både positiva och negativa skillnader, vilket innebär att summan av samma avvikelser kommer att bli
-2+2=0,
vilket gör att det felaktigt ser ut som att talen 4 och 8 inte avviker från medelvärdet. Det gör att metoden är oanvändbar för att beräkna spridning.
Katthemmet Glada Tassen har ett antal rum med 7 katter i varje. I ett rum gäller att:
Variationsbredden för båda rummen är skillnaden mellan den äldsta och den yngsta kattens åldrar för alla fjorton katter. För att maximera skillnaden vill vi att katterna i det ena rummet ska vara så gamla som möjligt och katterna i det andra rummet så unga som möjligt.
Medianen måste vara 5, och om vi vill att katternas ska vara så gamla som möjligt får ingen vara yngre än så. Därför låter vi fyra av katterna, alltså de som hamnar under medianen, vara 5 år gamla. Eftersom variationsbredden i rummet ska vara 6 år måste då den äldsta katten bli 5+6=11 år.
Det spelar ingen roll vad de två sista åldrarna är, så länge de ligger mellan 5 och 11.
"Mediankatten" är fortfarande 5 år i det här rummet. För att minimera åldrarna skulle vi vilja att de fyra äldsta katterna är 5 år gamla. Men då kan variationsbredden inte bli 6 år eftersom minst en katt då skulle behöva vara -1 år. Därför låter vi den yngsta katten vara 0 år och den äldsta 6.
Det spelar ingen roll hur gamla de övriga katterna är.
Den äldsta möjliga katten kan alltså vara 11 år och yngsta möjliga 0 år. För katterna i båda rummen blir då den totala variationsbredden 11-0=11 år.
Det enda man har fått reda på är de maximala bredbandshastigheterna. Man vet ingenting om deras lägsta hastighet. Låt säga att att INTERNET2000 har en minimihastighet på 25 Mbit/s, medan SURFA har minst 90 Mbit/s. Då varierar SURFA mellan 90 och 100 Mbit/s medan INTERNET2000 varierar mellan 25 och 125 Mbit/s.
Då har INTERNET2000 betydligt större spridning medan SURFA har betydligt mindre. Detta betyder att det är väldigt svårt att avgöra vem som har snabbast internet, eftersom vi inte känner till någonting om variationsbredden, utan endast det maximala värdet för leverantörerna.
Vi kallar talen, i stigande ordning, för a, b, c, d och e. Medianen är c, så c=16. Vi ställer upp ett uttryck för medelvärdet som är 13.
För att medelvärdet ska bli 13 måste alltså summan av a, b, d och e vara 49. Variationsbredden är skillnaden mellan det största och minsta talet, dvs. e-a. För att den ska bli så stor som möjligt ska e vara så stor som möjligt och a så litet som möjligt. Eftersom talen är positiva heltal kan a inte vara mindre än 1. Då har vi 1 b 16 d e. Vad är det största värdet e kan ha? Det kan inte vara hur stort som helst eftersom summan av a, b, d och e måste bli 49. Talet e blir därför så stort som möjligt när de andra är så små som möjligt. b måste vara större än 1 så det kan minst vara 2, och d måste vara större än 16 så det är minst 17: 1 2 16 17 e. Nu kan vi beräkna vad e blir.
Den största variationsbredden får man alltså om a=1 och e=29 och då blir den e-a=29-1=28. Den största variationsbredden man kan få är 28.