en envejs ANOVA (“variansanalyse”) sammenligner midlerne til tre eller flere uafhængige grupper for at afgøre, om der er en statistisk signifikant forskel mellem de tilsvarende populationsmidler.
denne vejledning forklarer, hvordan man udfører en envejs ANOVA for hånd.
eksempel: envejs ANOVA for hånd
Antag, at vi vil vide, om tre forskellige eksamensforberedelsesprogrammer fører til forskellige Gennemsnitlige score på en bestemt eksamen. For at teste dette rekrutterer vi 30 studerende til at deltage i en undersøgelse og opdele dem i tre grupper.
eleverne i hver gruppe tildeles tilfældigt til at bruge et af de tre eksamensforberedelsesprogrammer i de næste tre uger til at forberede sig til en eksamen. I slutningen af de tre uger tager alle studerende den samme eksamen.
eksamensresultaterne for hver gruppe er vist nedenfor:
Brug følgende trin til at udføre en envejs ANOVA for hånd for at afgøre, om den gennemsnitlige eksamensscore er forskellig mellem de tre grupper:
Trin 1: Beregn gruppemidlerne og det samlede gennemsnit.
først beregner vi gennemsnittet for alle tre grupper sammen med det samlede gennemsnit:
Trin 2: Beregn SSR.
dernæst beregner vi regressionssummen af kvadrater (SSR) ved hjælp af følgende formel:
n(JJ – H..)2
hvor:
- N: stikprøvestørrelsen af gruppe j
- liter: et græsk symbol, der betyder”sum”
- J: gennemsnittet af gruppe j
- H..: det samlede gennemsnit
i vores eksempel beregner vi, at SSR = 10(83.4-85.8)2 + 10(89.3-85.8)2 + 10(84.7-85.8)2 = 192.2
Trin 3: Beregn SSE.
dernæst beregner vi fejlsummen af kvadrater (SSE) ved hjælp af følgende formel:
:
- et græsk symbol, der betyder”sum”
- JJ: Ith-observationen i gruppe j
- JJ: gennemsnittet af gruppe j
i vores eksempel beregner vi SSE som følger:
gruppe 1: (85-83.4)2 + (86-83.4)2 + (88-83.4)2 + (75-83.4)2 + (78-83.4)2 + (94-83.4)2 + (98-83.4)2 + (79-83.4)2 + (71-83.4)2 + (80-83.4)2 = 640.4
gruppe 2: (91-89.3)2 + (92-89.3)2 + (93-89.3)2 + (85-89.3)2 + (87-89.3)2 + (84-89.3)2 + (82-89.3)2 + (88-89.3)2 + (95-89.3)2 + (96-89.3)2 = 208.1
gruppe 3: (79-84.7)2 + (78-84.7)2 + (88-84.7)2 + (94-84.7)2 + (92-84.7)2 + (85-84.7)2 + (83-84.7)2 + (85-84.7)2 + (82-84.7)2 + (81-84.7)2 = 252.1
SSE: 640.4 + 208.1 + 252.1 = 1100.6
Trin 4: Beregn SST.
dernæst beregner vi den samlede sum af kvadrater (SST) ved hjælp af følgende formel:
SST = SSR + SSE
i vores eksempel, SST = 192.2 + 1100.6 = 1292.8
Trin 5: Udfyld ANOVA-tabellen.
nu hvor vi har SSR, SSE og SST, kan vi udfylde ANOVA-tabellen:
kilde | summen af kvadrater (SS) | df | gennemsnitlige kvadrater (MS) | F |
---|---|---|---|---|
behandling | 192.2 | 2 | 96.1 | 2.358 |
fejl | 1100.6 | 27 | 40.8 | |
i alt | 1292.8 | 29 |
Sådan beregner vi de forskellige tal i tabellen:
- df behandling: k-1 = 3-1 = 2
- DF-fejl: n-k = 30-3 = 27
- df i alt: n-1 = 30-1 = 29
- MS behandling: SST / df behandling = 192.2 / 2 = 96.1
- MS-fejl: SSE / df-fejl = 1100.6 / 27 = 40.8
- F: MS-behandling / MS-fejl = 96.1 / 40.8 = 2.358
Bemærk: n = samlede observationer, k = antal grupper
Trin 6: fortolke resultaterne.
f-teststatistikken for denne envejs ANOVA er 2.358. For at afgøre, om dette er et statistisk signifikant resultat, skal vi sammenligne dette med den f-kritiske værdi, der findes i f-fordelingstabellen med følgende værdier:
- (signifikansniveau) = 0,05
- DF1 (tæller frihedsgrader) = DF-behandling = 2
- DF2 (nævneren frihedsgrader) = DF-fejl = 27
vi finder ud af, at den f kritiske værdi er 3.3541.
da f-teststatistikken i ANOVA-tabellen er mindre end den f-kritiske værdi i f-fordelingstabellen, afviser vi ikke nulhypotesen. Dette betyder, at vi ikke har tilstrækkelige beviser til at sige, at der er en statistisk signifikant forskel mellem de gennemsnitlige eksamensresultater for de tre grupper.