Logga in
| 7 sidor teori |
| 19 Uppgifter - Nivå 1 - 3 |
| Varje lektion är menad motsvara 1-2 lektioner i klassrummet. |
Minispelare aktiv
I den här lektionen går vi igenom följande begrepp:
Faktorer som orsakar missvisande resultat i en undersökning eller ett experiment kallas felkällor. För t.ex. en stickprovsundersökning kan det ske urvalsfel då stickprovet väljs. Det finns även risk för bortfall, exempelvis personer som inte svarar på en utskickad enkät. När själva undersökningen görs finns det alltid en risk för mätfel.
Om ett urval görs på ett sådant sätt att det inte är representativt för populationen säger man att det har gjorts ett urvalsfel. Om man vill undersöka hur många som äger en bil i en stad kommer det förmodligen att leda till ett urvalsfel om undersökningen utförs på en parkering, eftersom det är mer sannolikt att de personer som är där äger en bil.
När man har gjort en undersökning är det inte alltid möjligt att använda hela stickprovet. Det kan exempelvis bero på att vissa som intervjuas inte vill svara eller att de har fyllt i enkäten på fel sätt. Den del av resultatet som saknas i sådana fall kallas bortfall.
När man samlar in material till en undersökning kan det finnas fel i mätningarna som skapar en osäkerhet i resultatet. Det kan till exempel vara en dåligt formulerad enkätfråga som ger svårtolkade svar eller mätinstrument som inte är tillförlitliga. Denna sorts felkälla kallas mätfel.
Ett företag som arbetar med telefonundersökningar ringde upp personer på deras hemtelefonnummer dagtid kl 8.00-17.00.
Hur ofta tror du att någon i din familj kommer att använda lekparken?Vilka felkällor kan finnas i undersökningen?
Det kan finnas urvalsfel, bortfall och mätfel.
Ringer man under dagtid riskerar att man att missa många personer som arbetar eller studerar dagtid. I frågan som ställs kan man tolka betydelsen av ordet familj på olika sätt.
Det kan finnas urvalsfel, bortfall och mätfel.
Personer som inte vill eller har tid framför inte sin åsikt, vilket innebär ett bortfall.
På en skola skickade man ut en enkät till samtliga 1200 elever, där man bl.a. frågade om man spelar ett instrument. 276 svarade ja och 574 svarade nej, resten besvarade aldrig enkäten.
Hitta bortfallet genom att subtrahera antalet besvarade enkäter från det totala antalet utskickade enkäter. Tänk på fallet där hela bortfallet inte skulle spela ett instrument, och fallet där hela bortfallet skulle spela ett instrument.
Båda undersökningarna har en osäkerhet i form av ett konfidensintervall och en felmarginal. Den första gav resultatet 47 % med en felmarginal på 5 procentenheter, dvs. det korrekta värdet ligger med 95 % säkerhet mellan 47 % - 5 % = 42 % och 47 % + 5 % = 52 %. Kallar vi stödet för x är då intervallet 42 % ≤ x ≤ 52 %.
Den andra undersökningen hade samma felmarginal runt resultatet 23 %, vilket ger att det korrekta värdet y med 95 % säkerhet ligger i intervallet 18 % ≤ y ≤ 28 %. Det finns inget överlapp mellan de två intervallen, men är minskningen statistiskt säkerställd på 95 %-ig nivå? Sannolikheten att hamna inom felmarginalen för en av undersökningarna är 95 %, men för att båda ska göra det gäller sannolikheten 0,95 * 0,95 = 0,9025, där sannolikheten för båda händelserna har multiplicerats med varandra. Sannolikheten att båda mätningarna ligger inom intervallet är alltså lägre än 95 % så vi kan inte med säkerhet veta att förändringen är statistiskt säkerställd på 95 %-ig nivå. Vi kan dock säga att den är säkerställd på 90,25 %-ig nivå.
Resultatet från första frågetillfället visade att 25 % föredrar vit och 75 % svart mobil. Detta illustreras i bilden nedan. Kom dock ihåg att det fanns ett visst bortfall här, så resultatet är baserat på färre än 1 000 personers svar.
När bortfallet sedan svarade ändrades resultatet. Det visade sig då att 50 % föredrar vit och 50 % svart mobil, dvs. 500 personer föredrar respektive färg. Detta kan vi se som det "sanna" resultatet av undersökningen, eftersom det inte finns något bortfall.
Om delen som svarade svart i den första omgången är så stor som möjligt får vi det minsta bortfallet. Eftersom det sanna svaret är 500 kan antalet i de svarta rutorna i den första undersökningen vara maximalt 500 personer.
Antalet som motsvarar dessa 75 % måste också utgöras av ett tal som är jämnt delbart med 3 (där varje del motsvarar 25 %). Annars kommer antalet människor som svarade på undersökningen vid första frågetillfället inte motsvara ett heltal. För att hitta det högsta talet som är delbart med 3 provar vi oss fram från 500 och nedåt. Vi använder att ett tal är delbart med 3 om dess siffersumma är delbar med 3. 500:& 5+0+0=5, ej delbart med3 [0.5em] 499:& 4+9+9=22, ej delbart med3 [0.5em] 498:& 4+9+8=21, delbart med3 För att få det minsta bortfallet måste alltså 498 personer ha svarat svart vid första frågetillfället. Detta tal motsvarar 75 %, så 25 % är lika med 498/3=166 personer. Det innebär att det var 166 st. som svarade vit vid samma tillfälle. Totala antalet svarande var alltså 498+166=664 personer, vilket get ett bortfall på 1 000-664=336 personer. Det var alltså minst 336 personer som inte svarade på fråga vid första frågetillfället, vilket motsvarar 336/1 000=0,336=33,6 %.
Vi vet att en tillverkare kontrollerar var 50:e telefon från löpande bandet för att utvärdera kvaliteten. Låt oss ta en titt på exemplen på opartiska urval.
Opartiska urval | |
---|---|
Typ | Beskrivning |
Enkelt slumpmässigt urval | Varje objekt eller person i populationen har lika stor sannolikhet att väljas som alla andra. |
Systematiskt slumpmässigt urval | Objekten eller personerna väljs ut enligt ett specifikt tids- eller objektintervall. |
Vi kan se att urvalet är ett systematiskt slumpmässigt urval. Detta innebär att vi kan dra slutsatser om alla produkter baserat på vårt urval. Chefen hittade 4 defekta telefoner i urvalet av 200 telefoner.
Vi vet att 2 % av telefonerna i urvalet är defekta. Eftersom urvalet är opartiskt kan vi dra slutsatsen att ungefär 2 % av de tillverkade mobiltelefonerna kommer att vara defekta. Slutsatsen är giltig.
Rådgivaren för elevrådet frågade varje tionde elev i lunchkön hur de föredrog att bli kontaktade med skolnyheter. Resultaten visas i tabellen. Är detta ett slumpmässigt urval? Om ja, anta att det finns 684 elever på skolan. Hur många kan förväntas föredra E-post?
Metod | Antal |
---|---|
E-post | 16 |
Nyhetsbrev | 12 |
Meddelande | 5 |
Telefon | 3 |
Elevrådets rådgivare vill ta reda på det bästa sättet att bli kontaktad med skolnyheterna. De frågade var tionde elev i en lunchkö. Låt oss ta en titt på exemplen på opartiska urval.
Opartiska urval | |
---|---|
Typ | Beskrivning |
Enkelt slumpmässigt urval | Varje objekt eller person i populationen har lika stor sannolikhet att väljas som alla andra. |
Systematiskt slumpmässigt urval | Objekten eller personerna väljs enligt ett specifikt tids- eller objektintervall. |
Vi kan se att urvalet är ett systematiskt slumpmässigt urval, så det är ett opartiskt urval. Vi kan göra generaliseringar om hela elevpopulationen baserat på urvalet. Låt oss titta på resultaten av undersökningen.
Metod | Antal |
---|---|
E-post | 16 |
Nyhetsbrev | 12 |
Meddelande | 5 |
Telefon | 3 |
Låt oss hitta procentandelen elever som föredrar e-post. Först, låt oss addera alla antal elever för att hitta det totala antalet elever som deltog i undersökningen. 16 + 12 + 5 + 3 = 36 Vi vet att 16 av 36 personer som deltog i undersökningen väljer e-post som sitt föredragna sätt att bli kontaktad. Låt oss skriva det som en bråkdel. 16/36 = 2/9 Det finns 684 elever på skolan. Vi kan förvänta oss att 29 av 684 elever skulle välja e-post.
Vi kan förvänta oss att 152 elever skulle föredra e-post.
Vi vill avgöra om en ökning av storleken på ett urval nödvändigtvis gör urvalet mer representativt för en population. Först, kom ihåg att för att ett urval ska vara opartiskt — representativt för den studerade populationen — måste det vara tillräckligt stort. Om det är för litet kan felet i vår uppskattning visa sig vara stort. För att svara på frågan, låt oss betrakta två situationer, A och B.
Föreställ dig att vi arbetar på ett bageri och vi vill veta vad en genomsnittlig limpa vitt bröd väger. För det väljer vi slumpmässigt 25 limpor, väger dem och beräknar sedan genomsnittet av resultaten. Detta kommer att ge oss en uppskattning av den genomsnittliga vikt på en limpa.
I det här fallet, om vi inkluderade ytterligare 25 slumpmässigt valda bröd och upprepade stegen, skulle den slutliga uppskattningen vara ännu närmare den faktiska genomsnittliga vikten. Detta beror på att eventuella avvikelser (ovanligt små eller stora limpor) skulle bli mindre viktiga i uppskattningsprocessen.
Föreställ dig att vi vill hitta den typiska längden på personerna på vår skola. För det mäter vi var tionde elev som kommer in i skolan på morgonen. Här är några av de längder vi skrev ner.
Eftersom varje elev har lika stor chans att bli vald är urvalet representativt och därför opartiskt. Det betyder att vi kan använda det för att göra generaliseringar om elevernas längd. Föreställ dig nu att alla våra vänner från basketlaget också vill delta i studien. De fortsätter att skriva ner sina längder.
Kom ihåg att basketspelarna inte på något sätt är representativa för alla elever när det gäller deras längd — de är mycket längre. Detta innebär att urvalet skulle bli partiskt om vi inkluderade dem alla i studien. Detta innebär att även om storleken på urvalet skulle öka, skulle resultaten inte längre vara korrekta.
I vissa situationer kan en ökning av urvalsstorleken resultera i att urvalet blir mindre representativt för en population och därför partiskt. Det är därför vi bör vara försiktiga när vi väljer ut föremål eller personer att lägga till i vårt urval. Om denna grupp är partisk kommer resultaten av vår studie inte att vara korrekta.