Statistická analýza znamená zkoumání trendů, vzorců a vztahů pomocí kvantitativních dat. Je to důležitý výzkumný nástroj používaný vědci, vlády, podniky, a další organizace.
Chcete-li vyvodit platné závěry, vyžaduje statistická analýza pečlivé plánování od samého začátku výzkumného procesu. Musíte specifikovat své hypotézy a rozhodovat o návrhu výzkumu, velikosti vzorku a postupu odběru vzorků.
po shromáždění dat z vašeho vzorku můžete data uspořádat a shrnout pomocí popisných statistik. Poté můžete pomocí inferenčních statistik formálně testovat hypotézy a provádět odhady o populaci. Nakonec můžete interpretovat a zobecnit svá zjištění.
tento článek je praktickým úvodem do statistické analýzy pro studenty a výzkumné pracovníky. Provedeme vás kroky pomocí dvou příkladů výzkumu. První zkoumá potenciální vztah příčiny a následku, zatímco druhý zkoumá potenciální korelaci mezi proměnnými.
Krok 1: Napište své hypotézy a naplánujte svůj výzkumný design
Chcete-li shromažďovat platná data pro statistickou analýzu, musíte nejprve zadat své hypotézy a naplánovat svůj výzkumný design.
psaní statistických hypotéz
cílem výzkumu je často zkoumat vztah mezi proměnnými v populaci. Začnete s predikcí a pomocí statistické analýzy tuto předpověď otestujete.
statistická hypotéza je formální způsob psaní předpovědi o populaci. Každá předpověď výzkumu je přeformulována do nulových a alternativních hypotéz,které lze testovat pomocí vzorových dat.
zatímco nulová hypotéza vždy předpovídá žádný účinek nebo žádný vztah mezi proměnnými, alternativní hypotéza uvádí vaši výzkumnou předpověď efektu nebo vztahu.
plánování návrhu výzkumu
návrh výzkumu je vaší celkovou strategií pro sběr a analýzu dat. Určuje statistické testy, které můžete použít k testování své hypotézy později.
nejprve se rozhodněte, zda váš výzkum použije popisný, korelační nebo experimentální design. Experimenty přímo ovlivňují proměnné, zatímco popisné a korelační studie měří pouze proměnné.
- v experimentálním návrhu můžete posoudit vztah příčiny a následku (např. vliv meditace na výsledky testů) pomocí statistických testů srovnání nebo regrese.
- v korelačním návrhu můžete zkoumat vztahy mezi proměnnými (např., rodičovský příjem a GPA) bez jakéhokoli předpokladu kauzality pomocí korelačních koeficientů a testů významnosti.
- v popisném návrhu můžete studovat charakteristiky populace nebo jevu (např. prevalence úzkosti u amerických vysokoškolských studentů) pomocí statistických testů k vyvození závěrů ze vzorových dat.
váš návrh výzkumu se také týká toho, zda budete porovnávat účastníky na úrovni skupiny nebo na individuální úrovni, nebo obojí.
- v návrhu mezi subjekty porovnáváte výsledky na úrovni skupiny účastníků, kteří byli vystaveni různým léčbám (např. ti, kteří provedli meditační cvičení, vs. ti, kteří tak neučinili).
- v designu uvnitř subjektů porovnáváte opakovaná opatření od účastníků, kteří se zúčastnili všech ošetření studie (např. skóre před a po provedení meditačního cvičení).
- Experimentální
- Korelační
měření proměnných
při plánování návrhu výzkumu byste měli operovat své proměnné a přesně se rozhodnout, jak je budete měřit.
pro statistickou analýzu je důležité zvážit úroveň měření vašich proměnných, která vám řekne, jaké údaje obsahují:
- kategorická data představují seskupení. Mohou být nominální (např., pohlaví) nebo ordinální (např. úroveň jazykových schopností).
- kvantitativní údaje představují částky. Mohou být na intervalové stupnici (např. skóre testu) nebo na stupnici poměru (např. věk).
mnoho proměnných lze měřit na různých úrovních přesnosti. Například údaje o věku mohou být kvantitativní (8 let) nebo kategorické(mladé). Pokud je proměnná číselně kódována (např. úroveň shody od 1-5), neznamená to automaticky, že je kvantitativní místo kategorické.
identifikace úrovně měření je důležitá pro výběr vhodných statistik a testů hypotéz. Můžete například vypočítat průměrné skóre s kvantitativními údaji, ale ne s kategorickými údaji.
ve výzkumné studii, spolu s měřítky vašich proměnných zájmu, budete často shromažďovat údaje o relevantních charakteristikách účastníka.
- Experimentální
- Korelační
proměnná | typ dat |
---|---|
věk | kvantitativní (poměr) |
pohlaví | kategorické (nominální) |
rasa nebo etnický původ | kategorický (nominální) |
výchozí skóre testu | kvantitativní (interval) |
konečné výsledky testů | kvantitativní (interval) |
proměnná | typ dat |
---|---|
rodičovský příjem | kvantitativní (poměr) |
GPA | kvantitativní (interval) |
Krok 2: Sběr dat ze vzorku
ve většině případů je příliš obtížné nebo nákladné shromažďovat údaje od každého člena populace, o kterou máte zájem studovat. Místo toho budete shromažďovat data ze vzorku.
Statistická analýza vám umožňuje aplikovat vaše nálezy nad rámec vlastního vzorku, pokud používáte vhodné postupy odběru vzorků. Měli byste se zaměřit na vzorek, který je reprezentativní pro populaci.
vzorkování pro statistickou analýzu
existují dva hlavní přístupy k výběru vzorku.
- vzorkování pravděpodobnosti: každý člen populace má šanci být vybrán do studie náhodným výběrem.
- vzorkování bez pravděpodobnosti: někteří členové populace mají větší pravděpodobnost, že budou vybráni do studie kvůli kritériím, jako je pohodlí nebo dobrovolný výběr.
teoreticky byste pro vysoce zobecnitelné nálezy měli použít metodu vzorkování pravděpodobnosti. Náhodný výběr snižuje zkreslení vzorkování a zajišťuje, že data z vašeho vzorku jsou ve skutečnosti typická pro populaci. Parametrické testy mohou být použity k vytvoření silných statistických závěrů, když jsou data shromažďována pomocí vzorkování pravděpodobnosti.
ale v praxi je zřídka možné shromáždit ideální vzorek. Zatímco vzorky non-pravděpodobnostní jsou více pravděpodobné, že bude zaujatý, jsou mnohem snazší nábor a sběr dat z. Neparametrické testy jsou vhodnější pro vzorky bez pravděpodobnosti, ale vedou k slabším závěrům o populaci.
pokud chcete použít parametrické testy pro vzorky, které nejsou pravděpodobné, musíte uvést, že:
- váš vzorek je reprezentativní pro populaci, na kterou zobecňujete své nálezy.
- váš vzorek postrádá systematické zkreslení.
mějte na paměti, že vnější platnost znamená, že své závěry můžete zobecnit pouze na ostatní, kteří sdílejí vlastnosti vašeho vzorku. Například výsledky ze západních, vzdělaných, industrializovaných, bohatých a demokratických vzorků (např., vysokoškoláci v USA) nejsou automaticky použitelné pro všechny non-podivné populace.
pokud použijete parametrické testy na data ze vzorků, které nejsou pravděpodobné, ujistěte se, že jste podrobně popsali omezení, do jaké míry mohou být vaše výsledky zobecněny ve vaší diskusní sekci.
vytvořte vhodný postup odběru vzorků
na základě zdrojů dostupných pro váš výzkum rozhodněte, jak budete přijímat účastníky.
- budete mít prostředky k propagaci svého studia široce, a to i mimo vaše univerzitní prostředí?
- budete mít prostředky k náboru různorodého vzorku, který představuje širokou populaci?
- máte čas kontaktovat a navázat kontakt s členy těžko dostupných skupin?
- experimentální
- korelační
Vypočítejte dostatečnou velikost vzorku
před náborem účastníků rozhodněte o velikosti vzorku buď při pohledu na jiné studie ve svém oboru, nebo pomocí statistik. Vzorek, který je příliš malý, může být nereprezentativní pro vzorek, zatímco vzorek, který je příliš velký, bude nákladnější, než je nutné.
existuje mnoho kalkulaček velikosti vzorku online. Používají se různé vzorce v závislosti na tom, zda máte podskupiny nebo jak přísná by měla být vaše studie(např. Zpravidla je nutné minimálně 30 jednotek nebo více na podskupinu.
Chcete-li používat tyto kalkulačky, musíte pochopit a zadat tyto klíčové komponenty:
- úroveň významnosti (alfa): riziko odmítnutí skutečné nulové hypotézy, kterou jste ochotni přijmout, obvykle stanoveno na 5%.
- statistická síla: pravděpodobnost, že vaše studie zjistí účinek určité velikosti, pokud existuje, obvykle 80% nebo vyšší.
- očekávaná velikost efektu: standardizovaný údaj o tom, jak velký bude očekávaný výsledek Vaší studie, obvykle založený na jiných podobných studiích.
- směrodatná odchylka populace: odhad populačního parametru na základě předchozí studie nebo vlastní pilotní studie.
Krok 3: shrňte svá data pomocí popisných statistik
jakmile shromáždíte všechna svá data, můžete je zkontrolovat a vypočítat popisné statistiky, které je shrnují.
zkontrolujte svá data
existují různé způsoby kontroly vašich dat, včetně následujících:
- uspořádání dat z každé proměnné ve frekvenčních distribučních tabulkách.
- zobrazení dat z klíčové proměnné v sloupcovém grafu pro zobrazení distribuce odpovědí.
- vizualizace vztahu mezi dvěma proměnnými pomocí rozptylového grafu.
vizualizací dat v tabulkách a grafech můžete posoudit, zda vaše data sledují zkreslené nebo normální rozdělení a zda existují nějaké odlehlé hodnoty nebo chybějící data.
normální rozdělení znamená, že Vaše data jsou symetricky rozložena kolem středu, kde leží většina hodnot, přičemž hodnoty se zužují na koncích ocasu.
naproti tomu zkosené rozdělení je asymetrické a má na jednom konci více hodnot než na druhém. Tvar distribuce je důležité mít na paměti, protože pouze některé popisné statistiky by měly být použity s zkosenými distribucemi.
extrémní odlehlé hodnoty mohou také vytvářet zavádějící statistiky, takže možná budete potřebovat systematický přístup k řešení těchto hodnot.
Vypočítejte Míry centrální tendence
Míry centrální tendence popisují, kde leží většina hodnot v datové sadě. Často jsou uváděna tři hlavní opatření centrální tendence:
- režim: nejoblíbenější odpověď nebo hodnota v datové sadě.
- medián: hodnota v přesném středu sady dat při objednávce od nízké po vysokou.
- průměr: součet všech hodnot děleno počtem hodnot.
v závislosti na tvaru rozdělení a úrovni měření však může být vhodné pouze jedno nebo dvě z těchto opatření. Například mnoho demografických charakteristik lze popsat pouze pomocí režimu nebo proporcí, zatímco proměnná jako reakční doba nemusí mít režim vůbec.
Vypočítejte míry variability
míry variability vám řeknou, jak jsou rozloženy hodnoty v datové sadě. Často jsou uváděna čtyři hlavní měřítka variability:
- rozsah: nejvyšší hodnota minus nejnižší hodnota datové sady.
- Mezikvartilní rozsah: rozsah střední poloviny datové sady.
- směrodatná odchylka: průměrná vzdálenost mezi každou hodnotou ve vaší datové sadě a průměrem.
- rozptyl: čtverec směrodatné odchylky.
Opět platí, že tvar rozdělení a úroveň měření by měl vést váš výběr statistik variability. Mezikvartilní rozsah je nejlepším měřítkem pro zkosené rozdělení, zatímco směrodatná odchylka a rozptyl poskytují nejlepší informace pro normální rozdělení.
- experimentální
- korelační
pomocí tabulky byste měli zkontrolovat, zda jsou jednotky popisné statistiky srovnatelné pro skóre pretest a posttest. Například, jsou úrovně rozptylu podobné napříč skupinami? Existují nějaké extrémní hodnoty? Pokud existují, možná budete muset před provedením statistického testu identifikovat a odstranit extrémní odlehlé hodnoty ve vaší datové sadě nebo transformovat data.
Pretest skóre | posttest skóre | |
---|---|---|
průměr | 68.44 | 75.25 |
směrodatná odchylka | 9.43 | 9.88 |
rozptyl | 88.96 | 97.96 |
rozsah | 36.25 | 45.12 |
N | 30 |
z této tabulky vidíme, že průměrné skóre se po meditačním cvičení zvýšilo a odchylky obou skóre jsou srovnatelné. Dále můžeme provést statistický test, abychom zjistili, zda je toto zlepšení skóre testů statisticky významné v populaci.
je důležité zkontrolovat, zda máte širokou škálu datových bodů. Pokud tak neučiníte, vaše údaje mohou být zkresleny vůči některým skupinám více než jiné (např.
rodičovský příjem (USD) | GPA | |
---|---|---|
průměr | 62,100 | 3.12 |
směrodatná odchylka | 15,000 | 0.45 |
rozptyl | 225,000,000 | 0.16 |
rozsah | 8,000–378,000 | 2.64–4.00 |
N | 653 |
dále můžeme vypočítat korelační koeficient a provést statistický test, abychom pochopili význam vztahu mezi proměnnými v populaci.
Krok 4: Testujte hypotézy nebo proveďte odhady pomocí inferenční statistiky
číslo, které popisuje vzorek, se nazývá statistika, zatímco číslo popisující populaci se nazývá parametr. Pomocí inferenčních statistik můžete na základě vzorových statistik vyvodit závěry o parametrech populace.
vědci často používají dvě hlavní metody (současně) k vyvození závěrů ve statistice.
- odhad: výpočet parametrů populace na základě statistik vzorků.
- testování hypotéz: formální proces testování výzkumných předpovědí o populaci pomocí vzorků.
odhad
ze vzorových statistik můžete vytvořit dva typy odhadů parametrů populace:
- bodový odhad: hodnota, která představuje váš nejlepší odhad přesného parametru.
- intervalový odhad: rozsah hodnot, které představují váš nejlepší odhad, kde leží parametr.
pokud je vaším cílem odvodit a hlásit populační charakteristiky ze vzorových dat, je nejlepší použít ve svém příspěvku bodové i intervalové odhady.
statistiku vzorku můžete považovat za bodový odhad parametru populace, pokud máte reprezentativní vzorek (např. v širokém průzkumu veřejného mínění je podíl vzorku, který podporuje současnou vládu, považován za populační podíl příznivců vlády).
v odhadu je vždy chyba, takže byste měli také poskytnout interval spolehlivosti jako intervalový odhad, který ukazuje variabilitu kolem bodového odhadu.
interval spolehlivosti používá standardní chybu a skóre z ze standardního normálního rozdělení k vyjádření, kde byste obecně očekávali, že většinu času najdete parametr populace.
testování hypotéz
pomocí dat ze vzorku můžete testovat hypotézy o vztazích mezi proměnnými v populaci. Testování hypotéz začíná předpokladem, že nulová hypotéza je v populaci pravdivá, a pomocí statistických testů vyhodnotíte, zda lze nulovou hypotézu odmítnout nebo ne.
statistické testy určují, kde by vaše vzorová data ležela na očekávané distribuci vzorových dat, pokud by byla nulová hypotéza pravdivá. Tyto testy poskytují dva hlavní výstupy:
- statistika testu vám řekne, jak moc se vaše data liší od nulové hypotézy testu.
- hodnota p vám říká pravděpodobnost získání vašich výsledků, pokud je nulová hypotéza v populaci skutečně pravdivá.
statistické testy se dodávají ve třech hlavních odrůdách:
- srovnávací testy hodnotí skupinové rozdíly ve výsledcích.
- regresní testy hodnotí vztahy příčin a následků mezi proměnnými.
- korelační testy hodnotí vztahy mezi proměnnými bez předpokladu příčinné souvislosti.
váš výběr statistického testu závisí na vašich výzkumných otázkách, návrhu výzkumu, metodě odběru vzorků a charakteristikách dat.
parametrické testy
parametrické testy vytvářejí silné závěry o populaci na základě vzorových dat. Abychom je však mohli použít, musí být splněny některé předpoklady a lze použít pouze některé typy proměnných. Pokud vaše data porušují tyto předpoklady, můžete místo toho provést vhodné transformace dat nebo použít alternativní neparametrické testy.
regresní modeluje, do jaké míry změny v prediktorové proměnné vedou ke změnám ve výsledné proměnné(proměnných).
- jednoduchá lineární regrese zahrnuje jednu proměnnou prediktoru a jednu proměnnou výsledku.
- vícenásobná lineární regrese zahrnuje dvě nebo více prediktorových proměnných a jednu výslednou proměnnou.
srovnávací testy obvykle porovnávají prostředky skupin. Mohou to být prostředky různých skupin ve vzorku (např. léčená a kontrolní skupina), prostředky jedné skupiny vzorků odebrané v různých časech (např. výsledky předběžného testu a posttestu) nebo průměr vzorku a průměr populace.
- t test je určen přesně pro 1 nebo 2 skupiny, pokud je vzorek malý (30 nebo méně).
- z test je přesně pro 1 nebo 2 skupiny, pokud je vzorek Velký.
- Anova je pro 3 nebo více skupin.
testy z a t mají podtypy založené na počtu a typech vzorků a hypotézách:
- pokud máte pouze jeden vzorek, který chcete porovnat s průměrem populace, použijte test s jedním vzorkem.
- pokud máte spárovaná měření (návrh uvnitř subjektů), použijte test závislých (spárovaných) vzorků.
- pokud máte zcela oddělená měření ze dvou nesrovnatelných skupin (návrh mezi subjekty), použijte nezávislý test vzorků.
- pokud očekáváte rozdíl mezi skupinami v určitém směru, použijte jednoocasý test.
- pokud nemáte žádná očekávání ohledně směru rozdílu mezi skupinami, použijte dvouocasý test.
jediným parametrickým korelačním testem je Pearsonův r. korelační koeficient (r) vám říká sílu lineárního vztahu mezi dvěma kvantitativními proměnnými.
Chcete-li však otestovat, zda je korelace ve vzorku dostatečně silná, aby byla v populaci důležitá, musíte také provést test významnosti korelačního koeficientu, obvykle t test, abyste získali hodnotu p. Tento test používá velikost vzorku k výpočtu toho, jak moc se korelační koeficient liší od nuly v populaci.
- experimentální
- korelační
Krok 5: Interpretujte své výsledky
posledním krokem statistické analýzy je interpretace vašich výsledků.
statistická významnost
v testování hypotéz je statistická významnost hlavními kritérii pro vytváření závěrů. Porovnáte svou hodnotu p s nastavenou úrovní významnosti (obvykle 0,05), abyste rozhodli, zda jsou vaše výsledky statisticky významné nebo nevýznamné.
statisticky významné výsledky se považují za nepravděpodobné, že by vznikly pouze náhodou. Existuje jen velmi malá šance, že k takovému výsledku dojde, pokud je nulová hypotéza pravdivá v populaci.
- experimentální
- korelační
velikost efektu
statisticky významný výsledek nemusí nutně znamenat, že existují důležité aplikace v reálném životě nebo klinické výsledky pro zjištění.
naproti tomu velikost efektu ukazuje praktický význam vašich výsledků. Je důležité hlásit velikosti efektů spolu s inferenciálními statistikami, abyste získali úplný obraz o svých výsledcích. Pokud píšete papír ve stylu APA, měli byste také nahlásit intervalové odhady velikostí efektů.
- experimentální
- korelační
chyby rozhodnutí
chyby typu I a typu II jsou chyby učiněné v závěrech výzkumu. Chyba typu I znamená odmítnutí nulové hypotézy, když je skutečně pravdivá, zatímco chyba typu II znamená odmítnutí nulové hypotézy, když je nepravdivá.
můžete se snažit minimalizovat riziko těchto chyb výběrem optimální úrovně významnosti a zajištěním vysokého výkonu. Mezi těmito dvěma chybami je však kompromis, takže je nutná jemná rovnováha.
Frequentistická versus Bayesovská statistika
tradičně frequentistická statistika zdůrazňuje testování významnosti nulové hypotézy a vždy začíná předpokladem skutečné nulové hypotézy.
nicméně, Bayesovská statistika rostla v popularitě jako alternativní přístup v posledních několika desetiletích. V tomto přístupu používáte předchozí výzkum k neustálé aktualizaci svých hypotéz na základě vašich očekávání a pozorování.
Bayesův faktor porovnává relativní sílu důkazů pro nulovou versus alternativní hypotézu spíše než k závěru o odmítnutí nulové hypotézy nebo ne.
Nejčastější dotazy týkající se statistické analýzy
Statistická analýza je hlavní metodou analýzy kvantitativních výzkumných dat. Používá pravděpodobnosti a modely k testování předpovědí o populaci ze vzorových dat.
Popisná statistika shrnuje Vlastnosti datové sady. Inferenční statistiky umožňují otestovat hypotézu nebo posoudit, zda jsou vaše data zobecnitelná pro širší populaci.
testování hypotéz je formální postup pro zkoumání našich představ o světě pomocí statistik. Vědci jej používají k testování konkrétních předpovědí, nazývaných hypotézy, výpočtem, jak je pravděpodobné, že by náhodou mohl vzniknout vzorec nebo vztah mezi proměnnými.
při testování statistických hypotéz nulová hypotéza testu vždy předpovídá žádný účinek nebo žádný vztah mezi proměnnými, zatímco alternativní hypotéza uvádí vaši výzkumnou předpověď efektu nebo vztahu.
statistická významnost je termín používaný výzkumníky k tvrzení, že je nepravděpodobné, že by k jejich pozorování mohlo dojít podle nulové hypotézy statistického testu. Významnost je obvykle označována hodnotou p nebo hodnotou pravděpodobnosti.
statistická významnost je libovolná-záleží na prahové hodnotě nebo alfa hodnotě zvolené výzkumným pracovníkem. Nejběžnější prahová hodnota je p < 0,05, což znamená, že data se pravděpodobně vyskytnou méně než 5% času podle nulové hypotézy.
když hodnota p klesne pod zvolenou hodnotu alfa, pak říkáme, že výsledek testu je statisticky významný.