1b
Kurs 1b Visa detaljer
5. Signifikans och felkällor
Fortsätt till nästa lektion
Lektion
Övningar
Tester
Kapitel 4
5. 

Signifikans och felkällor

Denna lektion kommer lära dig teorin för att helt förstå ämnet, och det finns både uppgifter och självtester för att kontrollera din förståelse.
Begrepp Modellering Problemlösning Procedur Resonemang och Kommunikation
Inställningar & verktyg för lektion
10 sidor teori
19 Uppgifter - Nivå 1 - 3
Varje lektion är menad motsvara 1-2 lektioner i klassrummet.
Signifikans och felkällor
Sida av 10
I den här lektionen går vi igenom följande begrepp:
  • Felmarginal
  • Konfidensintervall
  • Urvalsfel
  • Bortfall
  • Mätfel

Förkunskaper

Teori

Felmarginal

I matematik hanterar man exakta värden, men det gör man sällan i verkligheten. Resultaten man får kommer då att få en viss osäkerhet, en felmarginal, som anger inom vilket intervall man kan förvänta sig att hitta det exakta värdet. I en statistisk undersökning kan felmarginalen exempelvis bero på hur stor andel urvalet utgör i förhållande till hela populationen.

Horisontell linje med ett intervall och en punkt inuti som representerar det sanna värdet.
Teori

Konfidensintervall

När man anger resultatet av en undersökning är det inte ovanligt att man ser det tillsammans med en felmarginal, t.ex.34±3 kg. Denna felmarginal är ett mått på osäkerheten i resultatet, dvs. hur nära undersökningens värde det verkliga värdet förväntas ligga. För att ge ett mått på denna osäkerhet används konfidensintervall. Detta brukar anges med en procentsats. Om 34± 3 är ett 95 %-igt konfidensintervall betyder det att sannolikheten är 95 % att det verkliga värdet ligger någonstans mellan 31 och 37kg.
Konfidensintervall
Från andra stickprov erhölls intervallen 40 ± 3kg och 36 ± 3 kg. Ökningen är statistiskt signifikant mellan 34 ± 3 kg och 40 ± 3 kg, eftersom de inte överlappar, vilket gör slump osannolik. Däremot tyder överlappningen mellan 34 ± 3 kg och 36 ± 3kg på ingen statistiskt signifikant ökning.
Exempel

Konfidensintervall i en valundersökning

I en valundersökning fick ett parti 12,5 % av rösterna. Felmarginalen är 2,0 procentenheter. Vad är konfidensintervallet?

Ledtråd

Beräkna konfidensintervallet genom att addera och subtrahera felmarginalen till procentandelen som partiet fick i undersökningen.

Lösning

Det politiska partiet fick 12,5 % av rösterna i en undersökning av väljare. Felmarginalen är 2 procentenheter. Addera och subtrahera detta värde till och från procentandelen som partiet fick för att bestämma konfidensintervallet. (12,5 - 2; 12,5 + 2) ⇓ (10,5; 14,5) Detta betyder att konfidensintervallet är mellan 10,5 % och 14,5 %.

Exempel

Statistisk signifikans i träningsvanor

En undersökning av pensionärer visar att regelbunden träningsaktivitet har ökat över åren — sett till andel.

År Andel
2010 (27± 3) %
2015 (36± 3) %
2020 (41± 3) %
Vilka av ökningarna mellan åren är statistiskt signifikanta?

Ledtråd

Använd felmarginalen för att hitta konfidensintervallet för varje år. Jämför intervallen för varje par av år. Överlappar intervallen?

Lösning

En ökning är statistiskt signifikant om konfidensintervallen för de år som jämförs inte överlappar. Detta betyder att konfidensintervallen först måste bestämmas. För att göra det, addera och subtrahera felmarginalen på 3 procentenheter för varje år.

År Andel
2010 24 % -- 30 %
2015 33 % -- 39 %
2020 38 % -- 44 %

Konfidensintervallen för 2010 och 2020 överlappar inte, så ökningen från 2010 till 2020 är statistiskt signifikant. Detsamma gäller för ökningen mellan 2010 och 2015. Däremot är ökningen mellan 2015 och 2020 inte statistiskt signifikant, eftersom deras konfidensintervall överlappar. ✓& 2010 och 2020 ✓& 2010 och 2015 & 2015 och 2020

Teori

Urvalsfel

Om ett urval görs på ett sådant sätt att det inte är representativt för populationen säger man att det har gjorts ett urvalsfel. Om man vill undersöka hur många som äger en bil i en stad kommer det förmodligen att leda till ett urvalsfel om undersökningen utförs på en parkering, eftersom det är mer sannolikt att de personer som är där äger en bil.

Stickprovets storlek är viktigt vid urval. Små stickprov kan leda till fel och kanske inte representerar populationen väl, medan större stickprov minskar risken för misstag och ger mer tillförlitliga resultat.
Teori

Bortfall

När man har gjort en undersökning är det inte alltid möjligt att använda hela stickprovet. Det kan exempelvis bero på att vissa som intervjuas inte vill svara eller att de har fyllt i enkäten på fel sätt. Den del av resultatet som saknas i sådana fall kallas bortfall.

Teori

Mätfel

När man samlar in material till en undersökning kan det finnas fel i mätningarna som skapar en osäkerhet i resultatet. Det kan till exempel vara en dåligt formulerad enkätfråga som ger svårtolkade svar eller mätinstrument som inte är tillförlitliga. Denna sorts felkälla kallas mätfel. Confused-man.jpg

En annan typ av fel är tolkningsfel, som uppstår när respondenter missförstår en fråga eller tolkar den annorlunda än avsett, vilket resulterar i felaktiga svar.
Exempel

Undersökning om Rivellakonsumtion

I en urvalsundersökning tillfrågades 480 slumpmässigt utvalda 20-åringar följande fråga:

Har du konsumerat Rivella under den senaste månaden?

Resultatet var 135 Ja, 165 Nej, och resten svarade inte. En uppföljande studie av gruppen som inte svarade visade att 75 % av dem som inte svarade hade konsumerat Rivella under den senaste månaden.

a Hur stor var gruppen som inte svarade? Svara i antal personer och procent.
b Beräkna andelen bland dem som svarade.
c Beräkna andelen för hela urvalet.

Svar

a 180 personer eller 37,5 %
b 45 % svarade Ja och 55 % svarade Nej.
c 56 % drack Rivella och 44 % gjorde det inte.

Ledtråd

a Hitta det totala antalet personer som svarade på undersökningen, och beräkna sedan antalet personer som inte svarade.
b Dela antalet personer som drack respektive inte drack Rivella med det totala antalet personer som genomförde undersökningen.
c Beräkna 75 % av dem som inte svarade på undersökningen för att bestämma antalet personer som drack Rivella förra månaden men inte svarade. Ta sedan fram det totala antalet personer som drack respektive inte drack Rivella.

Lösning

a Forskningsgruppen består av 480 personer, varav 135 svarade Ja och 165 svarade Nej, medan resten inte svarade. Addera 135 och 165 för att bestämma det totala antalet personer som svarade på undersökningen.

Personer som svarade 135 + 165 = 300 Därefter, subtrahera detta antal från 480 för att beräkna antalet personer som inte svarade på undersökningen. Personer som inte svarade 480 - 300 = 180 Det är 180 personer som inte svarade på undersökningen. Slutligen, dividera detta antal med det totala antalet personer i undersökningsgruppen för att bestämma andelen personer som inte svarade på undersökningen. 180/480=0,375 Detta betyder att 37,5 % av personerna inte svarade på undersökningen.

b För att beräkna andelen personer som svarade Ja och Nej i undersökningen, beakta endast de personer som svarade. Titta på antalet personer som gav respektive svar.

Ja: & 135personer Nej:& 165personer Tidigare fastställdes att 300 personer svarade på undersökningen. Dividera antalet personer som valde respektive svarsalternativ med 300 för att hitta deras respektive procentandelar. Ja: & 135/300 = 0,45 [0.6em] Nej:& 165/300 = 0,55 Detta betyder att 45 % av personerna som svarade på undersökningen svarade Ja, och 55 % av personerna som svarade på undersökningen svarade Nej.

c Syftet med undersökningen är att fastställa antalet personer som drack Rivella förra månaden. Det konstaterades att 135 personer som svarade på undersökningen drack Rivella.

Personer som svarade och konsumerade Rivella 135 personer Det är också givet att 75 % av de som inte svarade, alltså personer som inte deltog i undersökningen, också drack Rivella förra månaden. Tidigare fastställdes att det finns 180 personer som inte svarade på undersökningen. Multiplicera det med 0,75 för att ta reda på hur många i gruppen som inte svarade faktiskt drack Rivella. Personer som inte svarade och konsumerade Rivella 0.75 * 180 = 135 personer Nästa steg är att addera antalet personer som drack Rivella i båda grupperna för att hitta det totala antalet sådana personer. Personer som konsumerade Rivella 135 + 135 = 270 Subtrahera detta antal från det totala antalet personer i urvalet för att beräkna antalet personer som inte drack Rivella förra månaden. Personer som inte konsumerade Rivella 480 - 270 = 210 Nu, bestäm procentandelen av personer som drack respektive inte drack Rivella förra månaden genom att dividera de motsvarande antalen med 480. Drack: &270/480 ≈ 0,56 [0.6em] Drack inte: &210/480≈ 0,44 Därför drack ungefär 56 % av de 480 personerna Rivella förra månaden, och 44 % gjorde det inte.

Avslut

Förstå osäkerhet och noggrannhet i data

Denna lektion gick igenom följande ämnen:

Exakta populationsvärden kan oftast inte fastställas. Istället används uppskattningar, vilket innebär en viss osäkerhet. Felmarginalen och konfidensintervallet visar hur mycket uppskattningen kan skilja sig från det sanna värdet. En mindre felmarginal innebär att uppskattningen är mer precis.
Konfidensintervall
Fel i en studie kan också påverka resultaten. Vanliga fel är urvalsfel, mätfel, bortfall och tolkningsfel.
Feltyp Beskrivning
Urvalsfel Urvalet representerar inte populationen på ett bra sätt.
Mätfel Misstag orsakade av otydliga frågor eller oprecisa verktyg.
Bortfall Deltagare lämnar studien eller svarar inte, vilket kan påverka resultaten.
Tolkningsfel Svar misstolkas eller misstolkas vid avläsning.
När man jämför uppskattningar från olika urval är det viktigt att kontrollera om skillnaden är verklig. Om konfidensintervallen överlappar kanske förändringen inte är signifikant. Statistisk signifikans hjälper till att visa om en skillnad beror på en verklig förändring eller bara slumpmässig variation. Noggrann datainsamling och tydlig tolkning leder till bättre slutsatser.
Signifikans och felkällor
Övningar
>
2
e
7
8
9
×
÷1
=
=
4
5
6
+
<
log
ln
log
1
2
3
()
sin
cos
tan
0
.
π
x
y