Logga in
| 10 sidor teori |
| 19 Uppgifter - Nivå 1 - 3 |
| Varje lektion är menad motsvara 1-2 lektioner i klassrummet. |
I matematik hanterar man exakta värden, men det gör man sällan i verkligheten. Resultaten man får kommer då att få en viss osäkerhet, en felmarginal, som anger inom vilket intervall man kan förvänta sig att hitta det exakta värdet. I en statistisk undersökning kan felmarginalen exempelvis bero på hur stor andel urvalet utgör i förhållande till hela populationen.
Beräkna konfidensintervallet genom att addera och subtrahera felmarginalen till procentandelen som partiet fick i undersökningen.
En undersökning av pensionärer visar att regelbunden träningsaktivitet har ökat över åren — sett till andel.
År | Andel |
---|---|
2010 | (27±3)% |
2015 | (36±3)% |
2020 | (41±3)% |
Använd felmarginalen för att hitta konfidensintervallet för varje år. Jämför intervallen för varje par av år. Överlappar intervallen?
En ökning är statistiskt signifikant om konfidensintervallen för de år som jämförs inte överlappar. Detta betyder att konfidensintervallen först måste bestämmas. För att göra det, addera och subtrahera felmarginalen på 3 procentenheter för varje år.
År | Andel |
---|---|
2010 | 24%–30% |
2015 | 33%–39% |
2020 | 38%–44% |
Om ett urval görs på ett sådant sätt att det inte är representativt för populationen säger man att det har gjorts ett urvalsfel. Om man vill undersöka hur många som äger en bil i en stad kommer det förmodligen att leda till ett urvalsfel om undersökningen utförs på en parkering, eftersom det är mer sannolikt att de personer som är där äger en bil.
När man har gjort en undersökning är det inte alltid möjligt att använda hela stickprovet. Det kan exempelvis bero på att vissa som intervjuas inte vill svara eller att de har fyllt i enkäten på fel sätt. Den del av resultatet som saknas i sådana fall kallas bortfall.
När man samlar in material till en undersökning kan det finnas fel i mätningarna som skapar en osäkerhet i resultatet. Det kan till exempel vara en dåligt formulerad enkätfråga som ger svårtolkade svar eller mätinstrument som inte är tillförlitliga. Denna sorts felkälla kallas mätfel.
I en urvalsundersökning tillfrågades 480 slumpmässigt utvalda 20-åringar följande fråga:
Har du konsumerat Rivella under den senaste månaden? |
Resultatet var 135 Ja,
165 Nej,
och resten svarade inte. En uppföljande studie av gruppen som inte svarade visade att 75% av dem som inte svarade hade konsumerat Rivella under den senaste månaden.
Jaoch 55% svarade
Nej.
Jaoch 165 svarade
Nej,medan resten inte svarade. Addera 135 och 165 för att bestämma det totala antalet personer som svarade på undersökningen.
Jaoch
Neji undersökningen, beakta endast de personer som svarade. Titta på antalet personer som gav respektive svar.
Ja,och 55% av personerna som svarade på undersökningen svarade
Nej.
Denna lektion gick igenom följande ämnen:
Exakta populationsvärden kan oftast inte fastställas. Istället används uppskattningar, vilket innebär en viss osäkerhet. Felmarginalen och konfidensintervallet visar hur mycket uppskattningen kan skilja sig från det sanna värdet. En mindre felmarginal innebär att uppskattningen är mer precis.Feltyp | Beskrivning |
---|---|
Urvalsfel | Urvalet representerar inte populationen på ett bra sätt. |
Mätfel | Misstag orsakade av otydliga frågor eller oprecisa verktyg. |
Bortfall | Deltagare lämnar studien eller svarar inte, vilket kan påverka resultaten. |
Tolkningsfel | Svar misstolkas eller misstolkas vid avläsning. |
För att utvärdera kvaliteten på sin produkt kontrollerar en tillverkare av mobiltelefoner varje 50:e telefon från produktionslinjen. Av 200 testade telefoner är 4 defekta. Chefen drar slutsatsen att cirka 2% av de producerade mobiltelefonerna kommer att vara defekta. Bestäm om slutsatsen är giltig. Motivera ditt svar.
Vi vet att en tillverkare kontrollerar var 50:e telefon från monteringslinjen för att utvärdera kvaliteten. Låt oss ta en titt på exemplen på opartiska urval.
Opartiska urval | |
---|---|
Typ | Beskrivning |
Enkelt slumpmässigt urval | Varje objekt eller person i populationen har lika stor sannolikhet att väljas som alla andra. |
Systematiskt slumpmässigt urval | Objekten eller personerna väljs ut enligt ett specifikt tids- eller objektintervall. |
Vi kan se att urvalet är ett systematiskt slumpmässigt urval. Detta innebär att vi kan dra slutsatser om alla produkter baserat på vårt urval. Chefen hittade 4 defekta telefoner i urvalet av 200 telefoner.
Vi vet att 2 % av telefonerna i urvalet är defekta. Eftersom urvalet är opartiskt kan vi dra slutsatsen att ungefär 2 % av de tillverkade mobiltelefonerna kommer att vara defekta. Slutsatsen är giltig.
Du väljer ett slumpmässigt urval av 200 från en population av 2000. Varje person i urvalet tillfrågas hur många timmar sömn han eller hon får varje natt. Medelvärdet för ditt urval är 8 timmar. Är det möjligt att medelvärdet för hela populationen endast är 7,5 timmar sömn varje natt? Förklara.
I en population på 2 000 är den genomsnittliga sömntiden 7,5 timmar. Vi frågar oss om det är möjligt att medelvärdet av ett slumpmässigt urval av 200 personer från denna population är 8 timmar. För att besvara denna fråga kommer vi först att titta på ett mindre exempel.
I detta exempel är den genomsnittliga sömntiden för populationen också 7,5 timmar. 6+6+7+7+7+8+8+8,5+10/9=7,5 Låt oss välja ett urval från denna population.
Observera att den genomsnittliga sömntiden för detta urval är 7,5 timmar. 6+8+8,5/3=7,5 I det mindre exemplet är det möjligt för den genomsnittliga sömntiden för ett urval att vara 7,5 timmar, även om medelvärdet för populationen är 8 timmar. Detsamma gäller för det större exemplet från övningen. Låt oss titta på exempel på fördelning av sömntid i en större population av människor.
Om det hände sig så att vi valde personer till urvalet med en större sömntid än 7,5 timmar, skulle den genomsnittliga sömntiden för urvalet vara större än 7,5 timmar — till exempel kan medelvärdet vara 8 timmar.
Sammanfattningsvis är det möjligt för den genomsnittliga sömntiden för urvalet att vara 8 timmar även om medelvärdet för populationen är 7,5 timmar.
Amy och Esteban beskriver ett sätt att öka noggrannheten i en undersökning. Är någon av dem korrekt? Förklara din resonemang.
Amy |
Undersökningen bör inkludera så många personer i populationen som möjligt. |
Esteban |
Urvalet för undersökningen bör väljas slumpmässigt. Flera slumpmässiga urval bör göras. |
Vi kommer att titta på varje påstående och se om påståendena är sanna. Låt oss titta på Amys sätt att öka noggrannheten i en undersökning.
Amy |- Undersökningen bör inkludera så många människor i populationen som möjligt.
Ju fler personer undersökningen inkluderar, desto mer liknar urvalet populationen. Därför har Amy rätt. Låt oss nu titta på Estebans sätt.
Esteban |- Urvalet för undersökningen bör väljas slumpmässigt. Flera slumpmässiga urval bör tas.
Vi vet att slumpmässigt urval minskar snedvridningen i experimentet. Genom att använda fler slumpmässiga urval kommer man också att mer exakt approximera hela populationen. Därför har Esteban också rätt.
Du undersöker 50 slumpmässigt valda åskådare på en teater om teatern bör producera en ny musikal. Diagrammet visar resultaten. Du drar slutsatsen att 80% av åskådarna stöder produktionen av en ny musikal. Är din slutsats giltig? Förklara.
Vi frågar 50 slumpmässigt utvalda åskådare på en teater om teatern ska sätta upp en ny musikal. Vi kan se resultaten av undersökningen i följande diagram.
Slutsatsen är att 80 % av publiken stöder produktionen av en ny musikal. Vi vill avgöra om denna slutsats är giltig. Låt oss först komma ihåg att vi har två typer av urval: ett opartiskt och ett partiskt. Här är vad vi vet om dem.
Definition | |
---|---|
Opartiskt urval | Ett opartiskt urval är representativt, vilket betyder att dess resultat är proportionella mot resultaten för en population. Vi kan använda opartiska urval för att dra slutsatser om en population. |
Partiskt urval | Ett partiskt urval överrepresenterar eller underrepresenterar en viss del av populationen, vilket gör det icke-representativt. Vi bör inte använda partiska urval för att dra slutsatser om en population. |
Nu består vårt urval av 50 slumpmässigt utvalda åskådare. Observera att detta är ett stort urval och att det också är slumpmässigt utvalt. Eftersom varje åskådare har lika stor chans att ingå i urvalet är urvalet representativt. Detta innebär att vi kan använda det för att dra slutsatser om en population. Låt oss då ta en titt på resultaten igen.
Vi ser att 40 av 50 personer är för en ny produktion, vilket är exakt 80 % av urvalet. Eftersom urvalet är opartiskt kan vi säga att 80 % av alla åskådare är för. Slutsatsen är giltig.
Vilket urval är bättre för att göra en uppskattning? Förklara.
Uppskatta antalet defekta pennor som produceras per dag. | |
---|---|
Urval A | Ett slumpmässigt urval av 500 pennor från 20 maskiner |
Urval B | Ett slumpmässigt urval av 500 pennor från 1 maskin |
Vi vill bestämma vilket av de två urval som är bäst för att göra en uppskattning.
Uppskatta antalet defekta pennor som produceras per dag. | ||
---|---|---|
Urval A | Ett slumpmässigt urval på 500 pennor från 20 maskiner | |
Urval B | Ett slumpmässigt urval på 500 pennor från 1 maskin |
Låt oss komma ihåg att vi kan få information om en population — alla producerade pennor — genom att undersöka ett urval från denna population. Ändå kan vi inte göra generaliseringar baserat på vilket urval som helst. Urvalet måste vara opartiskt, vilket innebär att det måste vara representativt för populationen. Låt oss nu fundera på vad som skiljer urval A och B från varandra.
Uppskatta antalet defekta pennor som produceras per dag. | ||
---|---|---|
Urval A | Ett slumpmässigt urval på 500 pennor från 20 maskiner | |
Urval B | Ett slumpmässigt urval på 500 pennor från 1 maskin |
Vi ser att i urval A kommer pennorna från 20 maskiner, och i urval B från bara 1. Som ett resultat är bara urval A representativt för populationen. Urval B innehåller pennor från bara en källa, vilket kan påverka resultaten av vår studie. Om maskinen till exempel fungerar dåligt kan vi få en felaktig uppfattning om att alla pennor är felproducerade. Till skillnad från urval A är urval B partiskt. rl Urval A: & Opartiskt Urval B: & Partiskt För att våra uppskattningar ska vara korrekta kan vi bara göra uppskattningar baserat på opartiska urval. Det är därför vi bör välja urval A för att göra en uppskattning.
Hur kan formuleringen av en fråga eller intervjuares tonläge påverka en undersökning? Ge ett exempel.
Vi vill förklara hur dessa två faktorer kan påverka en undersökning.
När vi genomför en undersökning bör vi vara försiktiga med ordvalet vi använder. Ibland gör formuleringen frågan suggestiv. Här är ett exempel på en fråga som antyder ett svar till respondenten.
Du gillar verkligen inte märke X, eller hur?
Om en intervjuare ställer den här frågan antyder de att den undersökta personen inte gillar märket. Detta gör att den intervjuade är mer benägen att svara ja
, även om detta inte är det sanna svaret. Ett annat sätt som vi kan påverka svaret från den undersökta personen är att använda vår ton. Låt oss ta en titt på en annan exempelfråga.
Röker du?
Om intervjuaren använder en ton som antyder att de ogillar rökning, kommer den intervjuade troligen att säga att de inte röker, även om det inte är fallet. Vi bör definitivt undvika dessa två typer av misstag när vi förmedlar en undersökning. Generellt sett är det bästa sättet att genomföra en undersökning genom att vara neutral.
Använd uppgifterna nedan för att besvara varje fråga.
Antal textmeddelanden | ||||
---|---|---|---|---|
30 | 60 | 59 | 83 | 41 |
37 | 66 | 63 | 60 | 92 |
53 | 42 | 47 | 32 | 79 |
53 | 80 | 41 | 51 | 85 |
73 | 71 | 69 | 31 | 69 |
57 | 60 | 70 | 91 | 67 |
Skatta befolkningsproportionen ρ av tonåringar som använder mobiltelefoner och skickar mer än 70 textmeddelanden varje dag.
Skatta befolkningsproportionen ρ av tonåringar som använder mobiltelefoner och skickar färre än 50 textmeddelanden varje dag.
Vi kommer att uppskatta populationsproportionen av tonåriga telefonanvändare som skickar mer än 70 meddelanden per dag. Därför kommer vi från tabellen att räkna antalet tonåringar som skickar mer än 70 meddelanden varje dag.
Antal textmeddelanden | ||||
---|---|---|---|---|
30 | 60 | 59 | 83 | 41 |
37 | 66 | 63 | 60 | 92 |
53 | 42 | 47 | 32 | 79 |
53 | 80 | 41 | 51 | 85 |
73 | 71 | 69 | 31 | 69 |
57 | 60 | 70 | 91 | 67 |
Från tabellen kan vi se att antalet datapunkter som har ett större värde än 70 är 8. Det vill säga, 8 tonåringar av 30 skickade mer än 70 meddelanden varje dag. Genom att använda denna information kan vi hitta . =8/30≈ 0,267
Den här gången kommer vi att uppskatta populationsproportionen av tonåriga telefonanvändare som skickar färre än 50 meddelanden per dag. För att göra det kommer vi att räkna från tabellen antalet tonåringar som skickar färre än 50 meddelanden varje dag.
Antal textmeddelanden | ||||
---|---|---|---|---|
30 | 60 | 59 | 83 | 41 |
37 | 66 | 63 | 60 | 92 |
53 | 42 | 47 | 32 | 79 |
53 | 80 | 41 | 51 | 85 |
73 | 71 | 69 | 31 | 69 |
57 | 60 | 70 | 91 | 67 |
Genom att titta på tabellen kan vi säga att 8 av 30 tonåringar skickade mindre än 50 meddelanden varje dag. Med hjälp av denna information, låt oss hitta . =8/30≈ 0,267