yksisuuntainen ANOVA (”varianssin analyysi”) vertaa kolmen tai useamman riippumattoman ryhmän keskiarvoja selvittääkseen, onko vastaavissa perusjoukon keskiarvoissa tilastollisesti merkitsevä ero.
tässä tutoriaalissa kerrotaan, miten yksisuuntainen ANOVA tehdään käsin.
esimerkki: yksisuuntainen Anova käsin
Oletetaan, että haluamme tietää, johtavatko kolme erilaista tenttivalmennusohjelmaa eri keskiarvoihin tietyssä kokeessa. Tätä testataksemme rekrytoimme 30 opiskelijaa osallistumaan tutkimukseen ja jaamme heidät kolmeen ryhmään.
jokaisen ryhmän opiskelijat satunnaistetaan käyttämään yhtä kolmesta tenttivalmennusohjelmasta seuraavan kolmen viikon ajan tenttiin valmistautumiseen. Kolmen viikon päätteeksi kaikki oppilaat suorittavat saman kokeen.
kunkin ryhmän kokeiden pisteet on esitetty alla:
käytä seuraavia vaiheita suorittaaksesi yksisuuntainen ANOVA käsin sen määrittämiseksi, onko kokeen keskiarvo erilainen kolmen ryhmän välillä:
Vaihe 1: Laske ryhmän keskiarvo ja kokonaiskeskiarvo.
ensin lasketaan kaikkien kolmen ryhmän keskiarvo yhdessä kokonaiskeskiarvon kanssa:
Vaihe 2: Laske SSR.
seuraavaksi lasketaan neliöiden regressiosumma (SSR) seuraavalla kaavalla:
nΣ(Xj – X..)2
missä:
- n: ryhmän J otoskoko
- Σ: Kreikkalainen symboli, joka tarkoittaa ”summaa”
- Xj: ryhmän J keskiarvo
- X..: kokonaiskeskiarvo
esimerkissämme laskemme, että SSR = 10(83.4-85.8)2 + 10(89.3-85.8)2 + 10(84.7-85.8)2 = 192.2
Vaihe 3: Laske SSE.
seuraavaksi lasketaan neliöiden virhesumma (SSE) seuraavalla kaavalla:
Σ (Xij-Xj) 2
missä:
- Σ: Kreikkalainen symboli, joka tarkoittaa ”summaa”
- Xij: ryhmän J ith havainto
- Xj: ryhmän J keskiarvo
esimerkissämme laskemme SSE: n seuraavasti:
Ryhmä 1: (85-83.4)2 + (86-83.4)2 + (88-83.4)2 + (75-83.4)2 + (78-83.4)2 + (94-83.4)2 + (98-83.4)2 + (79-83.4)2 + (71-83.4)2 + (80-83.4)2 = 640.4
ryhmä 2: (91-89.3)2 + (92-89.3)2 + (93-89.3)2 + (85-89.3)2 + (87-89.3)2 + (84-89.3)2 + (82-89.3)2 + (88-89.3)2 + (95-89.3)2 + (96-89.3)2 = 208.1
ryhmä 3: (79-84.7)2 + (78-84.7)2 + (88-84.7)2 + (94-84.7)2 + (92-84.7)2 + (85-84.7)2 + (83-84.7)2 + (85-84.7)2 + (82-84.7)2 + (81-84.7)2 = 252.1
SSE: 640.4 + 208.1 + 252.1 = 1100.6
Vaihe 4: Laske SST.
seuraavaksi lasketaan neliöiden kokonaissumma (SST) seuraavalla kaavalla:
SST = SSR + SSE
esimerkissämme SST = 192.2 + 1100.6 = 1292.8
Vaihe 5: Täytä ANOVA-taulukko.
nyt kun meillä on SSR, SSE ja SST, voimme täyttää anovan taulukon:
lähde | neliöiden summa (SS) | df | keskimääräiset neliöt (MS) | F |
---|---|---|---|---|
hoito | 192.2 | 2 | 96.1 | 2.358 |
virhe | 1100.6 | 27 | 40.8 | |
yhteensä | 1292.8 | 29 |
näin laskimme taulukon eri numerot:
- hoito: k-1 = 3-1 = 2
- df-virhe: n-k = 30-3 = 27
- df yhteensä: n-1 = 30-1 = 29
- MS hoito: SST / df hoito = 192.2 / 2 = 96.1
- MS-virhe: SSE / df-virhe = 1100.6 / 27 = 40.8
- F: MS-käsittely / MS-virhe = 96.1 / 40.8 = 2.358
Huom: n = kokonaishavainnot, k = ryhmien lukumäärä
Vaihe 6: tulkitse tulokset.
tämän yksisuuntaisen anovan F-testin tilasto on 2,358. Selvittääksemme, onko tämä tilastollisesti merkittävä tulos, meidän on verrattava tätä F-jakaumataulukosta löytyvään F-kriittiseen arvoon seuraavilla arvoilla:
- α (merkitsevyystaso) = 0, 05
- DF1 (osoittajan vapausasteet) = df käsittely = 2
- DF2 (nimittäjän vapausasteet) = df virhe = 27
huomaamme, että F kriittinen arvo on 3,3541.
koska anovan taulukon F-testin tilastollinen arvo on pienempi kuin F-jakaumataulukon F-kriittinen arvo, emme hylkää nollahypoteesia. Tämä tarkoittaa, että meillä ei ole riittävästi näyttöä sanoa, että on tilastollisesti merkittävä ero keskiarvon tentti tulokset kolmen ryhmän.