| {{ 'ml-lesson-number-slides' | message : article.intro.bblockCount }} |
| {{ 'ml-lesson-number-exercises' | message : article.intro.exerciseCount }} |
| {{ 'ml-lesson-time-estimation' | message }} |
Minispelare aktiv
Statistik är en uppsättning verktyg och tekniker som används för att samla in, organisera och tolka information. Dessa informationsbitar kallas också data, som statistiker analyserar.
En frekvenstabell används för att presentera datavärden och deras frekvenser i en viss datamängd. Tabellen listar de möjliga värdena eller utfallen av kategorin och hur många gånger varje värde eller utfall observeras. Som exempel presenteras åldrarna på en grupp studenter i en frekvenstabell.
Åldras (x) | Frekvens (f) |
---|---|
10 | 4 |
11 | 2 |
12 | 5 |
13 | 3 |
14 | 1 |
Total frekvens (n)=15 |
Åldern på individen är variabeln i denna datamängd, betecknad med x. Värdena i frekvenskolumnen f indikerar hur många studenter som har den specifika åldern. Till exempel finns det fyra studenter som är 10 år gamla. Den totala frekvensen, representerad med n, indikerar det totala antalet studenter i gruppen.
Mål | 0 | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|---|
Frekvens | 1 | 3 | 2 | 1 | 2 | 1 |
Lista de olika målantalen och räkna hur ofta varje antal förekommer för att få deras frekvenser.
Det finns sex olika kategorier: 0–5 mål. Till exempel gjordes det noll mål i 1 match, och ett mål i 3 matcher osv. Detta skrivs in i en tabell.
Mål | 0 | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|---|
Frekvens | 1 | 3 | 2 | 1 | 2 | 1 |
Ett cirkeldiagram är en cirkulär graf som används för att visa procentandelar av olika delar inom en helhet. Cirkeln är indelad i sektorer eller skivor i olika färger, där varje skiva representerar en annan grupp av data. Storleken på varje skiva beror på dess medelpunktsvinkel, som motsvarar gruppens andel av helheten.
Större centrala vinklar skapar större sektorer, vilket representerar större procentandelar. Hela cirkeln representerar 100% av datan, och varje 1% motsvarar en 3,6∘ central vinkel eftersom 100360∘=3,6∘. Procentandelar visas vanligtvis inom sektorerna. För små sektorer eller långa gruppnamn läggs etiketter till utanför diagrammet för att identifiera varje grupp, där etiketterna matchas med sektorernas färger.
Börja med att identifiera varje grupp i undersökningen. I detta fall finns det fem olika grupper: sport, musik, konst, läsning och naturvetenskaplig klubb. Dessa fem grupper har respektive 30, 20, 15, 25, och 10 elever.
Aktivitet | Frekvens |
---|---|
Sport | 30 |
Musik | 20 |
Konst | 15 |
Läsning | 25 |
Vetenskapsklubb | 10 |
Det totala antalet elever som deltog i undersökningen är 100, så frekvensen för varje grupp kommer att delas med detta värde för att beräkna dess relativa frekvens.
Aktivitet | Frekvens | Relativ frekvens |
---|---|---|
Sport | 30 | 10030=0,3 |
Musik | 20 | 10020=0,2 |
Konst | 15 | 10015=0,15 |
Läsning | 25 | 10025=0,25 |
Vetenskapsklubb | 10 | 10010=0,10 |
Aktivitet | Frekvens | Relativ frekvens | Medelpunktsvinkel |
---|---|---|---|
Sport | 30 | 10030=0,3 | 0,3⋅360∘=108∘ |
Musik | 20 | 10020=0,2 | 0,2⋅360∘=72∘ |
Konst | 15 | 10015=0,15 | 0,15⋅360∘=54∘ |
Läsning | 25 | 10025=0,25 | 0,25⋅360∘=90∘ |
Vetenskapsklubb | 10 | 10010=0,10 | 0,10⋅360∘=36∘ |
Börja med att rita en cirkel för att representera hela populationen av undersökningen.
Rita sedan en radie för att välja en startpunkt. Detta kan vara vilken radie som helst i cirkeln.
Justera en gradskiva med den startande radien och markera den centrala vinkeln som motsvarar den första gruppen, vilket i detta exempel är 108∘.
Rita radien som passerar genom den tidigare markeringen. Sektorn för den första gruppen är nu klar.
För att rita skivan för nästa grupp, placera gradskivan vid slutet av den föregående gruppen och markera nästa centrala vinkel.
Rita radien som passerar genom denna markering för att skapa den andra sektorn. Upprepa denna process tills varje sektor är ritad.
Slutligen, färglägg varje skiva i cirkeldiagrammet och lägg till etiketter med gruppnamn och procentandelar. Använd sidetiketter med motsvarande sektorfärger om det behövs. Var noga med att inkludera en beskrivande titel som tydligt anger vad diagrammet visar. Detta ger viktig kontext för diagrammets syfte och innehåll.
Ett stolpdiagram är en grafisk representation av en frekvenstabell. Varje stolpe motsvarar en kategori, och stolparnas höjd anger frekvensen i den kategorin. Stolpdiagram används oftast när kategorierna är värden, t.ex. hur många syskon eleverna i en skola har.
Om kategorierna inte kan storleksordnas brukar man istället använda ett stapeldiagram. Man kan t.ex. redovisa vilka typer av bilar som står parkerade på en gata.
Stapeldiagrammet visar en sammanfattning av vädret under ett år där höjden anger frekvensen i antal dagar. Använd diagrammet för att avgöra hur många dagar det regnade.
Om stapeln för regniga dagar inte motsvarar ett tydligt värde på y-axeln, summera frekvenserna för de andra väderförhållandena och subtrahera den summan från 365.
Antalet dagar med regn ligger någonstans mellan 70 och 80 dagar. Staplarna för övriga väderförhållanden är dock enklare att läsa av. Vi gör detta och subtraherar summan från 365 (vi antar att det inte är ett skottår) som är antalet dagar på ett år.
Ett linjediagram används för att visa hur en datamängd förändras i förhållande till en annan kvantitet, vilket ofta är en tidsperiod. För att skapa ett linjediagram bör en skala och intervall för koordinataxis väljas. Datapunkterna ritas sedan in och en linje som kopplar ihop punkterna dras. Överväg en tabell med värden som representerar tillväxten av en planta under flera veckor.
Växttillväxt | |||||
---|---|---|---|---|---|
Vecka | 1 | 2 | 3 | 4 | 5 |
Höjd (in) | 1,5 | 2,3 | 4 | 6,2 | 8 |
Höjddata inkluderar värden från 1,5 till 8, så en skala från 0 till 10 tum med ett intervall av 1 tum är rimlig. Den horisontella axeln kan representera tid i veckor och den vertikala axeln kan representera växtens höjd i tum. Nu kan punkterna plottas på ett koordinatsystem och kopplas samman.
Varje timme under ett dygn undersöktes hur många som gick över ett övergångsställe. Linjediagrammet nedan visar denna information.
Det gick alltså flest personer gick över övergångsstället klockan 18.
Det gick alltså 8 personer över övergångsstället klockan 14.
Histogram är, på samma sätt som stolp- och stapeldiagram, en grafisk representation av en frekvenstabell. Skillnaden är att kategorierna utgörs av intervall, inte specifika värden. En frukthandlare som vill undersöka vikterna på sina äpplen kan lättare se fördelningen om diagrammet visar som hur många äpplen som ingår i ett visst viktintervall (70–80 g, 80–90 g osv.) istället för att det finns en stolpe för varje enskilt värde. Det är förmodligen mer intressant att veta att 65 av äpplena väger mellan 100 och 110g än om vi skulle veta att t.ex. 4 äpplen väger exakt 105 g.
Denna lektion granskade några statistiska diagram. Dessa diagram är viktiga eftersom de presenterar information visuellt, vilket gör det lättare att upptäcka mönster och trender. Tabellen sammanfattar dessa statistiska verktyg och visar vilket som är bäst att använda beroende på tillgängliga data.
Diagram | Bäst att använda när |
---|---|
Frekvenstabell | Organisera och sammanfatta numeriska data i kategorier eller intervall. |
Cirkeldiagram | Jämföra proportioner inom en helhet. |
Stapel- och stolpdiagram | Visa skillnader mellan kategorier. |
Linjediagram | Visa trender och förändringar över tid. |
Histogram | Analysera fördelningen av numeriska data. |