Logga in
| 10 sidor teori |
| 19 Uppgifter - Nivå 1 - 3 |
| Varje lektion är menad motsvara 1-2 lektioner i klassrummet. |
I matematik hanterar man exakta värden, men det gör man sällan i verkligheten. Resultaten man får kommer då att få en viss osäkerhet, en felmarginal, som anger inom vilket intervall man kan förvänta sig att hitta det exakta värdet. I en statistisk undersökning kan felmarginalen exempelvis bero på hur stor andel urvalet utgör i förhållande till hela populationen.
Beräkna konfidensintervallet genom att addera och subtrahera felmarginalen till procentandelen som partiet fick i undersökningen.
En undersökning av pensionärer visar att regelbunden träningsaktivitet har ökat över åren — sett till andel.
År | Andel |
---|---|
2010 | (27±3)% |
2015 | (36±3)% |
2020 | (41±3)% |
Använd felmarginalen för att hitta konfidensintervallet för varje år. Jämför intervallen för varje par av år. Överlappar intervallen?
En ökning är statistiskt signifikant om konfidensintervallen för de år som jämförs inte överlappar. Detta betyder att konfidensintervallen först måste bestämmas. För att göra det, addera och subtrahera felmarginalen på 3 procentenheter för varje år.
År | Andel |
---|---|
2010 | 24%–30% |
2015 | 33%–39% |
2020 | 38%–44% |
Om ett urval görs på ett sådant sätt att det inte är representativt för populationen säger man att det har gjorts ett urvalsfel. Om man vill undersöka hur många som äger en bil i en stad kommer det förmodligen att leda till ett urvalsfel om undersökningen utförs på en parkering, eftersom det är mer sannolikt att de personer som är där äger en bil.
När man har gjort en undersökning är det inte alltid möjligt att använda hela stickprovet. Det kan exempelvis bero på att vissa som intervjuas inte vill svara eller att de har fyllt i enkäten på fel sätt. Den del av resultatet som saknas i sådana fall kallas bortfall.
När man samlar in material till en undersökning kan det finnas fel i mätningarna som skapar en osäkerhet i resultatet. Det kan till exempel vara en dåligt formulerad enkätfråga som ger svårtolkade svar eller mätinstrument som inte är tillförlitliga. Denna sorts felkälla kallas mätfel.
I en urvalsundersökning tillfrågades 480 slumpmässigt utvalda 20-åringar följande fråga:
Har du konsumerat Rivella under den senaste månaden? |
Resultatet var 135 Ja,
165 Nej,
och resten svarade inte. En uppföljande studie av gruppen som inte svarade visade att 75% av dem som inte svarade hade konsumerat Rivella under den senaste månaden.
Jaoch 55% svarade
Nej.
Jaoch 165 svarade
Nej,medan resten inte svarade. Addera 135 och 165 för att bestämma det totala antalet personer som svarade på undersökningen.
Jaoch
Neji undersökningen, beakta endast de personer som svarade. Titta på antalet personer som gav respektive svar.
Ja,och 55% av personerna som svarade på undersökningen svarade
Nej.
Denna lektion gick igenom följande ämnen:
Exakta populationsvärden kan oftast inte fastställas. Istället används uppskattningar, vilket innebär en viss osäkerhet. Felmarginalen och konfidensintervallet visar hur mycket uppskattningen kan skilja sig från det sanna värdet. En mindre felmarginal innebär att uppskattningen är mer precis.Feltyp | Beskrivning |
---|---|
Urvalsfel | Urvalet representerar inte populationen på ett bra sätt. |
Mätfel | Misstag orsakade av otydliga frågor eller oprecisa verktyg. |
Bortfall | Deltagare lämnar studien eller svarar inte, vilket kan påverka resultaten. |
Tolkningsfel | Svar misstolkas eller misstolkas vid avläsning. |
Ökar storleken på ett urval nödvändigtvis urvalets representativitet för en population? Ge ett exempel för att stödja din förklaring.
Vi vill avgöra om en ökning av storleken på ett urval nödvändigtvis gör urvalet mer representativt för en population. Först, kom ihåg att för att ett urval ska vara opartiskt — representativt för den studerade populationen — måste det vara tillräckligt stort. Om det är för litet kan felet i vår uppskattning visa sig vara stort. För att svara på frågan, låt oss nu betrakta två situationer, A och B.
Föreställ dig att vi arbetar på ett bageri och vi vill veta vad en genomsnittlig limpa vitt bröd väger. För det väljer vi slumpmässigt 25 limpor, väger dem och beräknar sedan genomsnittet av resultaten. Detta ger oss en uppskattning av den genomsnittliga vikt en limpa har.
I det här fallet, om vi inkluderade ytterligare 25 slumpmässigt valda bröd och upprepade stegen, skulle den slutliga uppskattningen vara ännu närmare den faktiska genomsnittliga vikten. Detta beror på att eventuella avvikelser (ovanligt små eller stora limpor) skulle bli mindre viktiga i uppskattningsprocessen.
Föreställ dig att vi vill ta reda på den typiska längden på personerna på vår skola. För det mäter vi var tionde elev som kommer in i skolan på morgonen. Här är några av de längder vi skrev ner.
Eftersom varje elev har lika stor chans att bli vald är urvalet representativt och därför opartiskt. Det betyder att vi kan använda det för att göra generaliseringar om elevernas längd. Föreställ dig nu att alla våra vänner från basketlaget också vill delta i studien. De fortsätter att skriva ner sina längder.
Kom ihåg att basketspelarna inte på något sätt är representativa för alla elever när det gäller deras längd — de är mycket längre. Detta innebär att urvalet skulle bli partiskt om vi inkluderade dem alla i studien. Detta innebär att även om urvalets storlek skulle öka, skulle resultaten inte längre vara korrekta.
I vissa situationer kan en ökning av urvalsstorleken leda till att urvalet blir mindre representativt för en population och därför partiskt. Det är därför vi bör vara försiktiga när vi väljer ut föremål eller personer att lägga till i vårt urval. Om denna grupp är partisk kommer resultaten av vår studie inte att vara korrekta.
Fyrtio procent av alla sjundeklassare har besökt en statlig park. Hur nära uppskattar 200 slumpmässiga urval av 50 studenter procentandelen av sjundeklassare som har besökt en statlig park? Använd en simulering för att stödja ditt svar.
Vi får veta att 40 % av alla sjundeklassare har besökt en nationalpark. Vi vill ta reda på hur nära 200 slumpmässiga urval av 50 elever kan uppskatta denna procentandel. Låt oss först se att vi kan använda teknik för att simulera experiment med ett stort antal försök. Här är parametrarna för vår simulering.
Nu kan vi använda denna information för att köra vår simulering. Resultatet är en graf som visar frekvenserna för varje provprocent — procentandelen sjundeklassare som har besökt en nationalpark i ett prov. Ju högre stapel, desto vanligare provprocent.
Vi ser att provprocenten är grupperade kring 0,4 = 40 %. Majoriteten av uppskattningarna ligger också mellan 25 % och 55 %, vilket innebär att de flesta av proverna ligger inom 15 % av den faktiska procentandelen. 40 % - 15 % &= 25 % 40 % + 15 % &=55 % Observera att detta bara är en exempellösning. I allmänhet är resultaten av en simulering olika varje gång vi kör den, vilket är anledningen till att uppskattningarna också kan variera.
Förklara varför opinionsundersökningar använder urvalsstorlekar på mer än 1000 personer istället för att använda en mindre urvalsstorlek.
Vi vill förklara varför opinionsundersökningar använder urvalsstorlekar på mer än 1 000 personer istället för att använda en mindre urvalsstorlek. Låt oss ta ett exempel om väljare i USA. USA:s befolkning är en mycket mångfacetterad nation med över 330 miljoner människor. Det är många människor!
Att undersöka varje person som bor i USA är omöjligt. Det är därför vi använder oss av urval. Om vi ser till att vårt urval är representativt för den studerade gruppen, är dess resultat proportionella mot befolkningens och vi kan använda det för att göra generaliseringar.
Låt oss föreställa oss att en undersökning ställer följande fråga till personer som har rätt att rösta. &Planerar du att gå till vallokalerna i det kommande &valet? & Ja & Nej Vi förväntar oss att vissa personer bestämmer sig för att inte rösta, och vi vill uppskatta det antalet. Men vi vill att undersökningsprocessen ska vara överkomlig, så vi kan bara undersöka en liten grupp röstberättigade — inte hela USA:s befolkning. Om urvalsstorleken vi väljer är för liten finns det anledningar till varför det inte skulle fungera.
I ett litet urval är chanserna stora att vi inte inkluderar en enda medlem av ett visst samhälle. Personer av spanskt eller polskt ursprung kan till exempel utelämnas. Som ett resultat är dessa grupper underrepresenterade i studien.
I ett litet urval påverkar en enskild persons åsikt slutresultatet mer än i ett stort urval. Tänk dig att en person väljer att ge ett positivt svar även om de tänker negativt. Detta kommer att avsevärt öka andelen människor som är för.
Vi kan vara benägna att tro att för att urvalet ska vara opartiskt bör det inkludera tusentals människor. Intressant nog visar det sig att ett slumpmässigt urval av minst 1 000 personer från olika regioner, kulturer och bakgrunder kan vara representativt för USA:s befolkning. Det är därför vi inte bör spendera mer pengar på att undersöka fler människor.
Liten urvalsstorlek | Större än 1 000 personer | |
---|---|---|
Fördelar | prisvärd | representativ |
Nackdelar | ofta partisk | dyrt (för stora urval) |
Figuren visar fördelningen av urvalsproportionerna från tre simuleringar med olika urvalsstorlekar. Vilken simulering har den minsta felmarginalen? Förklara din resonemang.
Låt oss börja med att komma ihåg att felmarginalen talar om för oss om en gräns för hur mycket svaren från urvalet skulle skilja sig från svaren från hela populationen. Med detta i åtanke, låt oss ta en titt på den givna grafen som presenterar urvalsproportionerna från 3 simuleringar.
När vi tittar på grafen kan vi se att urval a har den minsta standardavvikelsen σ eftersom dess fördelning är den smalaste. Å andra sidan har fördelningen av urval c den bredaste fördelningen, så detta urval har den största standardavvikelsen. σ_a< σ_b< σ_c När exempeldatavärden skiljer sig mycket från varandra kan vi misstänka att svaren från urvalet också kan skilja sig mycket från svaren från populationen. Därför kommer urval med de största standardavvikelserna att ha de största felmarginalerna ME. σ_a < σ_b < σ_c ⇓ ME_a < ME_b < ME_c Detta innebär att simulering a kommer att ha den minsta felmarginalen och simulering c kommer att ha den största felmarginalen.