Frihedsgrader

Hvad er en frihedsgrad?


Ordet frihedsgrad dækker over hver enkelt uafhængigt datapunkt, der kan variere og stadigvæk indgå i udregningen af en parameter.
Frihedsgrader er nogle gange noteret med det græske bogstav \(\nu\) (Ny), DOF (Degrees Of Freedom) eller bare df.

Frihedsgrader i en \(\chi ^2\)-test

I Tabel 1 nedenfor er givet en \(2\times2\) tabel. En sådan \(2\times2\) tabel vil have 1 frihedsgrad, da de forskellige observationer skal summere op til det totale antal observationer, her n=20.

  \(A_1\) \(A_2\) Total
\(B_1\) ? 5 5+?
\(B_2\) 5 5 10
Total 5+? 10 20


I de udvidede tilfælde med r rækker og k kolonner gælder at \(\textit{df=(r-1)} \times \textit{(k-1)}\).
NB: I tilfældet med r rækker og 1 kolonne, gælder at \(\textit{df=r-1}\).

  \(A_1\) \(A_2\) \(A_3\) \(A_4\) \(A_5\) Total
\(B_1\)  ? 15 10 40
\(B_2\) ? ?  0 20  40
Total 10 15 5 35 15 80

 

Tabel 2 vil have 4 frihedsgrader. Det forstås at man frit vil kunne variere indholdet af 4 celler, og resten vil så være låst i forhold til de bestemmelser, der gør sig gældende.

Frihedsgrader i en t-test


Hvis man har en talrække på n tal: \(n_1 , n_2, ... n_i\) vil man have \(i-1\) frihedsgrader til at udregne gennemsnittet.
Hvis man tester for gennemsnittet med 10 måleresultater vil man derfor have \(\textit{df}=10-9\)frihedsgrader. Hvis man efterfølgende også estimerer variansen vil man have endnu en frihedsgrad mindre, da den første er brugt til at udregne gennemsnittet, som indgår i udregningen af varians.
Dette er vigtigt at have in mente når man udregner konfidensintervaller hvor

\(CI_\alpha = \bar{x} \pm t(\alpha, df) \cdot \frac{s}{\sqrt{n}}\), hvor \(t(\alpha, df)\) er din t-score på konfidensniveau \(\alpha\) med df frihedsgrader.

Har du en kommentar til indholdet på denne side? Send os en mail!