Grundlæggende begreber

Indenfor statstik er der en masse begreber, som det er værd at have styr på.

Stikprøve og population

Når man laver en statistisk undersøgelse, er det vigtigt at gøre sig det klart, hvem det er, man ønsker at sige noget om. Er det alle mennesker i Danmark? Alle mennesker i Høje Taastrup kommune? Alle tanglopper i Verden? Den gruppe, man vil undersøge noget om, kaldes populationen

Ofte er en population meget stor. Man kan f.eks. ikke veje alle tanglopper i Verden, eller spørge alle mennesker i Danmark hvad de ville stemme til næste Folketingsvalg.

Derfor udtager man en stikprøve. En stikprøve er en mindre gruppe indenfor populationen. Der findes forskellige måder at udtage en stikprøve på, men det vigtigste er, at den repræsenterer hele populationen. Man indsamler data fra sin stikprøve, og denne data generaliserer man så til at gælde hele populationen.

Observation, hyppighed, frekvens og kumuleret frekvens

Observationer i statistik er de ting, vi måler i vores undersøgelse. Hvis vi f.eks. ønsker at undersøge hvor store fødder 15-19-årige danskere har, kunne vi spørge din gymnasieklasse, hvilken skostørrelse, de bruger. Observationerne kunne her være skostørrelserne: 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47.

Det totale antal i stikprøven betegner man med n.

Hyppigheden for hver observation er det antal gange observationen forekommer. Hyppigheden for den i'te observation, betegner man tit hi.

Frekvensen er den procentdel, hvormed en observation forekommer.

$$\text{frekvens}=\frac{\text{hyppighed}}{\text{totalt antal observationer}}$$

Man betegner tit frekvensen for den i'te observation med fi

$$f_i=\frac{h_i}{n}$$

Den kumulerede frekvens (kumulere betyder opsamle) for en observation, får man ved at lægge frekvensen for den givne observation sammen med alle de frekvenser, hvor observationen er lavere. Den højeste observation har en kumuleret frekvens på 100% (nogle gange kan afrundinger dog gøre, at den bliver 99,9 eller 100,1)

$$(\text{kum.}\:f)_i=f_1+f_2+...+f_{i-1}+f_i=\sum_{k=1}^if_k\\$$
(Du kan læse om summationstegn her)

Lad os se på et eksempel, hvor vi har målt skostørrelsen på alle i en gymnasieklasse bestående af 28 elever.

Obs. Hyp. Frek. (%) Kum.frek.
36 1 3,57 3,57
37 2 7,14 10,71
38 1 3,57 14,28
39 4 14,29 28,57
40 3 10,71 39,28
41 4 14,29 53,57
42 3 10,71 64,28
43 3 10,71 74,99
44 4 14,29 89,28
45 2 7,14 96,42
46 0 0 96,42
47 1 3,57 99,99
I alt 28 (=n) 99,99  

Videolektion

Har du en kommentar til indholdet på denne side? Send os en mail!