Statistická analýza znamená zkoumání trendů, vzorců a vztahů pomocí kvantitativních dat. Je to důležitý výzkumný nástroj používaný vědci, vlády, podniky, a další organizace.

Chcete-li vyvodit platné závěry, vyžaduje statistická analýza pečlivé plánování od samého začátku výzkumného procesu. Musíte specifikovat své hypotézy a rozhodovat o návrhu výzkumu, velikosti vzorku a postupu odběru vzorků.

po shromáždění dat z vašeho vzorku můžete data uspořádat a shrnout pomocí popisných statistik. Poté můžete pomocí inferenčních statistik formálně testovat hypotézy a provádět odhady o populaci. Nakonec můžete interpretovat a zobecnit svá zjištění.

tento článek je praktickým úvodem do statistické analýzy pro studenty a výzkumné pracovníky. Provedeme vás kroky pomocí dvou příkladů výzkumu. První zkoumá potenciální vztah příčiny a následku, zatímco druhý zkoumá potenciální korelaci mezi proměnnými.

příklad: kauzální výzkumná otázka
může meditace zlepšit výkon zkoušky u dospívajících?
příklad: korelační výzkumná otázka
existuje vztah mezi rodičovským příjmem a průměrem vysokoškolského stupně (GPA)?

Krok 1: Napište své hypotézy a naplánujte svůj výzkumný design

Chcete-li shromažďovat platná data pro statistickou analýzu, musíte nejprve zadat své hypotézy a naplánovat svůj výzkumný design.

psaní statistických hypotéz

cílem výzkumu je často zkoumat vztah mezi proměnnými v populaci. Začnete s predikcí a pomocí statistické analýzy tuto předpověď otestujete.

statistická hypotéza je formální způsob psaní předpovědi o populaci. Každá předpověď výzkumu je přeformulována do nulových a alternativních hypotéz,které lze testovat pomocí vzorových dat.

zatímco nulová hypotéza vždy předpovídá žádný účinek nebo žádný vztah mezi proměnnými, alternativní hypotéza uvádí vaši výzkumnou předpověď efektu nebo vztahu.

příklad: statistické hypotézy k testování účinku
  • nulová hypotéza: 5minutové meditační cvičení nebude mít žádný vliv na skóre matematických testů u dospívajících.
  • alternativní hypotéza: 5minutové meditační cvičení zlepší skóre matematických testů u dospívajících.
příklad: Statistické hypotézy k testování korelace
  • nulová hypotéza: rodičovský příjem a GPA nemají u vysokoškolských studentů žádný vztah.
  • alternativní hypotéza: rodičovský příjem a GPA jsou pozitivně korelovány u vysokoškolských studentů.

plánování návrhu výzkumu

návrh výzkumu je vaší celkovou strategií pro sběr a analýzu dat. Určuje statistické testy, které můžete použít k testování své hypotézy později.

nejprve se rozhodněte, zda váš výzkum použije popisný, korelační nebo experimentální design. Experimenty přímo ovlivňují proměnné, zatímco popisné a korelační studie měří pouze proměnné.

  • v experimentálním návrhu můžete posoudit vztah příčiny a následku (např. vliv meditace na výsledky testů) pomocí statistických testů srovnání nebo regrese.
  • v korelačním návrhu můžete zkoumat vztahy mezi proměnnými (např., rodičovský příjem a GPA) bez jakéhokoli předpokladu kauzality pomocí korelačních koeficientů a testů významnosti.
  • v popisném návrhu můžete studovat charakteristiky populace nebo jevu (např. prevalence úzkosti u amerických vysokoškolských studentů) pomocí statistických testů k vyvození závěrů ze vzorových dat.

váš návrh výzkumu se také týká toho, zda budete porovnávat účastníky na úrovni skupiny nebo na individuální úrovni, nebo obojí.

  • v návrhu mezi subjekty porovnáváte výsledky na úrovni skupiny účastníků, kteří byli vystaveni různým léčbám (např. ti, kteří provedli meditační cvičení, vs. ti, kteří tak neučinili).
  • v designu uvnitř subjektů porovnáváte opakovaná opatření od účastníků, kteří se zúčastnili všech ošetření studie (např. skóre před a po provedení meditačního cvičení).
  • Experimentální
  • Korelační
Příklad: Experimentální výzkum design
navrhujete experiment uvnitř subjektů, abyste studovali, zda 5minutové meditační cvičení může zlepšit skóre matematických testů. Vaše studie provádí opakovaná opatření od jedné skupiny účastníků.

nejprve budete mít základní výsledky testů od účastníků. Poté vaši účastníci podstoupí 5minutové meditační cvičení. Nakonec zaznamenáte skóre účastníků z druhého matematického testu.

v tomto experimentu je nezávislou proměnnou 5minutové meditační cvičení a závislá proměnná je změna skóre matematických testů před a po zásahu.

příklad: návrh korelačního výzkumu
v korelační studii testujete, zda existuje vztah mezi rodičovským příjmem a GPA při absolvování vysokoškolských studentů. Chcete-li shromažďovat vaše údaje, požádáte účastníky, aby vyplnili průzkum a sami ohlásili příjmy svých rodičů a vlastní GPA.

v této studii nejsou žádné závislé nebo nezávislé proměnné, protože chcete měřit pouze proměnné, aniž byste je jakýmkoli způsobem ovlivňovali.

měření proměnných

při plánování návrhu výzkumu byste měli operovat své proměnné a přesně se rozhodnout, jak je budete měřit.

pro statistickou analýzu je důležité zvážit úroveň měření vašich proměnných, která vám řekne, jaké údaje obsahují:

  • kategorická data představují seskupení. Mohou být nominální (např., pohlaví) nebo ordinální (např. úroveň jazykových schopností).
  • kvantitativní údaje představují částky. Mohou být na intervalové stupnici (např. skóre testu) nebo na stupnici poměru (např. věk).

mnoho proměnných lze měřit na různých úrovních přesnosti. Například údaje o věku mohou být kvantitativní (8 let) nebo kategorické(mladé). Pokud je proměnná číselně kódována (např. úroveň shody od 1-5), neznamená to automaticky, že je kvantitativní místo kategorické.

identifikace úrovně měření je důležitá pro výběr vhodných statistik a testů hypotéz. Můžete například vypočítat průměrné skóre s kvantitativními údaji, ale ne s kategorickými údaji.

ve výzkumné studii, spolu s měřítky vašich proměnných zájmu, budete často shromažďovat údaje o relevantních charakteristikách účastníka.

  • Experimentální
  • Korelační
Příklad: Proměnné (experiment)
můžete provádět mnoho výpočtů s kvantitativními údaji o věku nebo skóre testu, zatímco kategorické proměnné lze použít k rozhodování seskupení pro srovnávací testy.

proměnná typ dat
věk kvantitativní (poměr)
pohlaví kategorické (nominální)
rasa nebo etnický původ kategorický (nominální)
výchozí skóre testu kvantitativní (interval)
konečné výsledky testů kvantitativní (interval)
příklad: Proměnné (korelační studie)
typy proměnných v korelační studii určují test, který použijete pro korelační koeficient. Pro kvantitativní data lze použít parametrický korelační test, zatímco neparametrický korelační test by měl být použit, pokud je jedna z proměnných ordinální.

proměnná typ dat
rodičovský příjem kvantitativní (poměr)
GPA kvantitativní (interval)

Krok 2: Sběr dat ze vzorku

populace vs vzorek

populace vs vzorek

ve většině případů je příliš obtížné nebo nákladné shromažďovat údaje od každého člena populace, o kterou máte zájem studovat. Místo toho budete shromažďovat data ze vzorku.

Statistická analýza vám umožňuje aplikovat vaše nálezy nad rámec vlastního vzorku, pokud používáte vhodné postupy odběru vzorků. Měli byste se zaměřit na vzorek, který je reprezentativní pro populaci.

vzorkování pro statistickou analýzu

existují dva hlavní přístupy k výběru vzorku.

  • vzorkování pravděpodobnosti: každý člen populace má šanci být vybrán do studie náhodným výběrem.
  • vzorkování bez pravděpodobnosti: někteří členové populace mají větší pravděpodobnost, že budou vybráni do studie kvůli kritériím, jako je pohodlí nebo dobrovolný výběr.

teoreticky byste pro vysoce zobecnitelné nálezy měli použít metodu vzorkování pravděpodobnosti. Náhodný výběr snižuje zkreslení vzorkování a zajišťuje, že data z vašeho vzorku jsou ve skutečnosti typická pro populaci. Parametrické testy mohou být použity k vytvoření silných statistických závěrů, když jsou data shromažďována pomocí vzorkování pravděpodobnosti.

ale v praxi je zřídka možné shromáždit ideální vzorek. Zatímco vzorky non-pravděpodobnostní jsou více pravděpodobné, že bude zaujatý, jsou mnohem snazší nábor a sběr dat z. Neparametrické testy jsou vhodnější pro vzorky bez pravděpodobnosti, ale vedou k slabším závěrům o populaci.

pokud chcete použít parametrické testy pro vzorky, které nejsou pravděpodobné, musíte uvést, že:

  • váš vzorek je reprezentativní pro populaci, na kterou zobecňujete své nálezy.
  • váš vzorek postrádá systematické zkreslení.

mějte na paměti, že vnější platnost znamená, že své závěry můžete zobecnit pouze na ostatní, kteří sdílejí vlastnosti vašeho vzorku. Například výsledky ze západních, vzdělaných, industrializovaných, bohatých a demokratických vzorků (např., vysokoškoláci v USA) nejsou automaticky použitelné pro všechny non-podivné populace.

pokud použijete parametrické testy na data ze vzorků, které nejsou pravděpodobné, ujistěte se, že jste podrobně popsali omezení, do jaké míry mohou být vaše výsledky zobecněny ve vaší diskusní sekci.

vytvořte vhodný postup odběru vzorků

na základě zdrojů dostupných pro váš výzkum rozhodněte, jak budete přijímat účastníky.

  • budete mít prostředky k propagaci svého studia široce, a to i mimo vaše univerzitní prostředí?
  • budete mít prostředky k náboru různorodého vzorku, který představuje širokou populaci?
  • máte čas kontaktovat a navázat kontakt s členy těžko dostupných skupin?
  • experimentální
  • korelační
příklad: vzorkování (experiment)
populace, o kterou máte zájem, jsou studenti středních škol ve vašem městě. Kontaktujete tři soukromé školy a sedm veřejných škol v různých okresech města, abyste zjistili, zda můžete svůj experiment spravovat studentům v 11.ročníku.

vaši účastníci jsou sami vybráni svými školami. Přestože používáte vzorek, který není pravděpodobný, zaměřujete se na různorodý a reprezentativní vzorek.

příklad: vzorkování (korelační studie)
vaše hlavní populace zájmu jsou vysokoškolští studenti v USA. Používání reklamy na sociálních médiích, přijímáte studenty vyšších ročníků z menší subpopulace: sedm univerzit v oblasti Bostonu.

vaši účastníci se dobrovolně účastní průzkumu, což z něj činí vzorek bez pravděpodobnosti.

Vypočítejte dostatečnou velikost vzorku

před náborem účastníků rozhodněte o velikosti vzorku buď při pohledu na jiné studie ve svém oboru, nebo pomocí statistik. Vzorek, který je příliš malý, může být nereprezentativní pro vzorek, zatímco vzorek, který je příliš velký, bude nákladnější, než je nutné.

existuje mnoho kalkulaček velikosti vzorku online. Používají se různé vzorce v závislosti na tom, zda máte podskupiny nebo jak přísná by měla být vaše studie(např. Zpravidla je nutné minimálně 30 jednotek nebo více na podskupinu.

Chcete-li používat tyto kalkulačky, musíte pochopit a zadat tyto klíčové komponenty:

  • úroveň významnosti (alfa): riziko odmítnutí skutečné nulové hypotézy, kterou jste ochotni přijmout, obvykle stanoveno na 5%.
  • statistická síla: pravděpodobnost, že vaše studie zjistí účinek určité velikosti, pokud existuje, obvykle 80% nebo vyšší.
  • očekávaná velikost efektu: standardizovaný údaj o tom, jak velký bude očekávaný výsledek Vaší studie, obvykle založený na jiných podobných studiích.
  • směrodatná odchylka populace: odhad populačního parametru na základě předchozí studie nebo vlastní pilotní studie.

jaké je vaše skóre plagiátorství?

Porovnejte svůj příspěvek s více než 60 miliardami webových stránek a 30 miliony publikací.

  • nejlepší kontrola plagiátů v roce 2021
  • zpráva o plagiátorství & procento
  • největší databáze plagiátů

Scribbr kontrola plagiátů

Krok 3: shrňte svá data pomocí popisných statistik

jakmile shromáždíte všechna svá data, můžete je zkontrolovat a vypočítat popisné statistiky, které je shrnují.

zkontrolujte svá data

existují různé způsoby kontroly vašich dat, včetně následujících:

  • uspořádání dat z každé proměnné ve frekvenčních distribučních tabulkách.
  • zobrazení dat z klíčové proměnné v sloupcovém grafu pro zobrazení distribuce odpovědí.
  • vizualizace vztahu mezi dvěma proměnnými pomocí rozptylového grafu.

vizualizací dat v tabulkách a grafech můžete posoudit, zda vaše data sledují zkreslené nebo normální rozdělení a zda existují nějaké odlehlé hodnoty nebo chybějící data.

normální rozdělení znamená, že Vaše data jsou symetricky rozložena kolem středu, kde leží většina hodnot, přičemž hodnoty se zužují na koncích ocasu.

 průměr, medián, režim a směrodatná odchylka v normálním rozdělení

průměr, medián, režim a směrodatná odchylka v normálním rozdělení

naproti tomu zkosené rozdělení je asymetrické a má na jednom konci více hodnot než na druhém. Tvar distribuce je důležité mít na paměti, protože pouze některé popisné statistiky by měly být použity s zkosenými distribucemi.

extrémní odlehlé hodnoty mohou také vytvářet zavádějící statistiky, takže možná budete potřebovat systematický přístup k řešení těchto hodnot.

Vypočítejte Míry centrální tendence

Míry centrální tendence popisují, kde leží většina hodnot v datové sadě. Často jsou uváděna tři hlavní opatření centrální tendence:

  • režim: nejoblíbenější odpověď nebo hodnota v datové sadě.
  • medián: hodnota v přesném středu sady dat při objednávce od nízké po vysokou.
  • průměr: součet všech hodnot děleno počtem hodnot.

v závislosti na tvaru rozdělení a úrovni měření však může být vhodné pouze jedno nebo dvě z těchto opatření. Například mnoho demografických charakteristik lze popsat pouze pomocí režimu nebo proporcí, zatímco proměnná jako reakční doba nemusí mít režim vůbec.

Vypočítejte míry variability

míry variability vám řeknou, jak jsou rozloženy hodnoty v datové sadě. Často jsou uváděna čtyři hlavní měřítka variability:

  • rozsah: nejvyšší hodnota minus nejnižší hodnota datové sady.
  • Mezikvartilní rozsah: rozsah střední poloviny datové sady.
  • směrodatná odchylka: průměrná vzdálenost mezi každou hodnotou ve vaší datové sadě a průměrem.
  • rozptyl: čtverec směrodatné odchylky.

Opět platí, že tvar rozdělení a úroveň měření by měl vést váš výběr statistik variability. Mezikvartilní rozsah je nejlepším měřítkem pro zkosené rozdělení, zatímco směrodatná odchylka a rozptyl poskytují nejlepší informace pro normální rozdělení.

  • experimentální
  • korelační
příklad: Popisná statistika (experiment)
po shromáždění předběžných a posttestových údajů od 30 studentů po celém městě vypočítáte popisné statistiky. Protože máte normální distribuovaná data na intervalové stupnici, uvedete do tabulky průměr, směrodatná odchylka, rozptyl a rozsah.

pomocí tabulky byste měli zkontrolovat, zda jsou jednotky popisné statistiky srovnatelné pro skóre pretest a posttest. Například, jsou úrovně rozptylu podobné napříč skupinami? Existují nějaké extrémní hodnoty? Pokud existují, možná budete muset před provedením statistického testu identifikovat a odstranit extrémní odlehlé hodnoty ve vaší datové sadě nebo transformovat data.

Pretest skóre posttest skóre
průměr 68.44 75.25
směrodatná odchylka 9.43 9.88
rozptyl 88.96 97.96
rozsah 36.25 45.12
N 30

z této tabulky vidíme, že průměrné skóre se po meditačním cvičení zvýšilo a odchylky obou skóre jsou srovnatelné. Dále můžeme provést statistický test, abychom zjistili, zda je toto zlepšení skóre testů statisticky významné v populaci.

příklad: Popisná statistika (korelační studie)
po shromáždění údajů od 653 studentů uvedete do tabulky popisné statistiky pro roční rodičovský příjem a GPA.

je důležité zkontrolovat, zda máte širokou škálu datových bodů. Pokud tak neučiníte, vaše údaje mohou být zkresleny vůči některým skupinám více než jiné (např.

rodičovský příjem (USD) GPA
průměr 62,100 3.12
směrodatná odchylka 15,000 0.45
rozptyl 225,000,000 0.16
rozsah 8,000–378,000 2.64–4.00
N 653

dále můžeme vypočítat korelační koeficient a provést statistický test, abychom pochopili význam vztahu mezi proměnnými v populaci.

Krok 4: Testujte hypotézy nebo proveďte odhady pomocí inferenční statistiky

číslo, které popisuje vzorek, se nazývá statistika, zatímco číslo popisující populaci se nazývá parametr. Pomocí inferenčních statistik můžete na základě vzorových statistik vyvodit závěry o parametrech populace.

vědci často používají dvě hlavní metody (současně) k vyvození závěrů ve statistice.

  • odhad: výpočet parametrů populace na základě statistik vzorků.
  • testování hypotéz: formální proces testování výzkumných předpovědí o populaci pomocí vzorků.

odhad

ze vzorových statistik můžete vytvořit dva typy odhadů parametrů populace:

  • bodový odhad: hodnota, která představuje váš nejlepší odhad přesného parametru.
  • intervalový odhad: rozsah hodnot, které představují váš nejlepší odhad, kde leží parametr.

pokud je vaším cílem odvodit a hlásit populační charakteristiky ze vzorových dat, je nejlepší použít ve svém příspěvku bodové i intervalové odhady.

statistiku vzorku můžete považovat za bodový odhad parametru populace, pokud máte reprezentativní vzorek (např. v širokém průzkumu veřejného mínění je podíl vzorku, který podporuje současnou vládu, považován za populační podíl příznivců vlády).

v odhadu je vždy chyba, takže byste měli také poskytnout interval spolehlivosti jako intervalový odhad, který ukazuje variabilitu kolem bodového odhadu.

interval spolehlivosti používá standardní chybu a skóre z ze standardního normálního rozdělení k vyjádření, kde byste obecně očekávali, že většinu času najdete parametr populace.

testování hypotéz

pomocí dat ze vzorku můžete testovat hypotézy o vztazích mezi proměnnými v populaci. Testování hypotéz začíná předpokladem, že nulová hypotéza je v populaci pravdivá, a pomocí statistických testů vyhodnotíte, zda lze nulovou hypotézu odmítnout nebo ne.

statistické testy určují, kde by vaše vzorová data ležela na očekávané distribuci vzorových dat, pokud by byla nulová hypotéza pravdivá. Tyto testy poskytují dva hlavní výstupy:

  • statistika testu vám řekne, jak moc se vaše data liší od nulové hypotézy testu.
  • hodnota p vám říká pravděpodobnost získání vašich výsledků, pokud je nulová hypotéza v populaci skutečně pravdivá.

statistické testy se dodávají ve třech hlavních odrůdách:

  • srovnávací testy hodnotí skupinové rozdíly ve výsledcích.
  • regresní testy hodnotí vztahy příčin a následků mezi proměnnými.
  • korelační testy hodnotí vztahy mezi proměnnými bez předpokladu příčinné souvislosti.

váš výběr statistického testu závisí na vašich výzkumných otázkách, návrhu výzkumu, metodě odběru vzorků a charakteristikách dat.

parametrické testy

parametrické testy vytvářejí silné závěry o populaci na základě vzorových dat. Abychom je však mohli použít, musí být splněny některé předpoklady a lze použít pouze některé typy proměnných. Pokud vaše data porušují tyto předpoklady, můžete místo toho provést vhodné transformace dat nebo použít alternativní neparametrické testy.

regresní modeluje, do jaké míry změny v prediktorové proměnné vedou ke změnám ve výsledné proměnné(proměnných).

  • jednoduchá lineární regrese zahrnuje jednu proměnnou prediktoru a jednu proměnnou výsledku.
  • vícenásobná lineární regrese zahrnuje dvě nebo více prediktorových proměnných a jednu výslednou proměnnou.

srovnávací testy obvykle porovnávají prostředky skupin. Mohou to být prostředky různých skupin ve vzorku (např. léčená a kontrolní skupina), prostředky jedné skupiny vzorků odebrané v různých časech (např. výsledky předběžného testu a posttestu) nebo průměr vzorku a průměr populace.

  • t test je určen přesně pro 1 nebo 2 skupiny, pokud je vzorek malý (30 nebo méně).
  • z test je přesně pro 1 nebo 2 skupiny, pokud je vzorek Velký.
  • Anova je pro 3 nebo více skupin.

testy z a t mají podtypy založené na počtu a typech vzorků a hypotézách:

  • pokud máte pouze jeden vzorek, který chcete porovnat s průměrem populace, použijte test s jedním vzorkem.
  • pokud máte spárovaná měření (návrh uvnitř subjektů), použijte test závislých (spárovaných) vzorků.
  • pokud máte zcela oddělená měření ze dvou nesrovnatelných skupin (návrh mezi subjekty), použijte nezávislý test vzorků.
  • pokud očekáváte rozdíl mezi skupinami v určitém směru, použijte jednoocasý test.
  • pokud nemáte žádná očekávání ohledně směru rozdílu mezi skupinami, použijte dvouocasý test.

jediným parametrickým korelačním testem je Pearsonův r. korelační koeficient (r) vám říká sílu lineárního vztahu mezi dvěma kvantitativními proměnnými.

Chcete-li však otestovat, zda je korelace ve vzorku dostatečně silná, aby byla v populaci důležitá, musíte také provést test významnosti korelačního koeficientu, obvykle t test, abyste získali hodnotu p. Tento test používá velikost vzorku k výpočtu toho, jak moc se korelační koeficient liší od nuly v populaci.

  • experimentální
  • korelační
příklad: spárovaný t test pro experimentální výzkum
vzhledem k tomu, že váš výzkumný návrh je experimentem uvnitř subjektů, měření pretest i posttest pocházejí ze stejné skupiny, takže potřebujete závislý (spárovaný ) t test. Vzhledem k tomu, že předpovídáte změnu v určitém směru (zlepšení skóre testů), potřebujete jednoocasý test.

k posouzení, zda meditační cvičení výrazně zlepšilo skóre matematických testů, používáte test závislých vzorků s jedním ocasem. Test vám dává:

  • hodnota t (statistika testu) 3,00
  • hodnota p 0.0028
příklad: korelační koeficient a test významnosti
Pearsonovo r používáte k výpočtu síly lineárního vztahu mezi rodičovským příjmem a GPA ve vašem vzorku. Pearsonova hodnota r je 0,12, což naznačuje malou korelaci ve vzorku.

ačkoli Pearsonovo r je testovací statistika, neříká vám nic o tom, jak významná je korelace v populaci. Musíte také otestovat, zda je tento korelační koeficient vzorku dostatečně velký, aby prokázal korelaci v populaci.

t test může také určit, jak významně se korelační koeficient liší od nuly na základě velikosti vzorku. Vzhledem k tomu, že očekáváte pozitivní korelaci mezi rodičovským příjmem a GPA, použijete jeden vzorek, jednoocasý t test. T test vám dává:

  • hodnota t 3,08
  • hodnota p 0.001

Krok 5: Interpretujte své výsledky

posledním krokem statistické analýzy je interpretace vašich výsledků.

statistická významnost

v testování hypotéz je statistická významnost hlavními kritérii pro vytváření závěrů. Porovnáte svou hodnotu p s nastavenou úrovní významnosti (obvykle 0,05), abyste rozhodli, zda jsou vaše výsledky statisticky významné nebo nevýznamné.

statisticky významné výsledky se považují za nepravděpodobné, že by vznikly pouze náhodou. Existuje jen velmi malá šance, že k takovému výsledku dojde, pokud je nulová hypotéza pravdivá v populaci.

  • experimentální
  • korelační
příklad: interpretujte své výsledky (experiment)
porovnáte hodnotu p 0,0027 s prahem významnosti 0,05. Protože vaše hodnota p je nižší, rozhodnete se odmítnout nulovou hypotézu a považujete své výsledky za statisticky významné.

to znamená, že věříte, že meditační intervence spíše než náhodné faktory přímo způsobily zvýšení skóre testů.

příklad: interpretujte své výsledky (korelační studie)
porovnáte hodnotu p 0,001 s prahem významnosti 0,05. S hodnotou p pod touto prahovou hodnotou můžete nulovou hypotézu odmítnout. To naznačuje statisticky významnou korelaci mezi rodičovským příjmem a GPA u mužských vysokoškoláků.

Všimněte si, že korelace nemusí vždy znamenat příčinnou souvislost, protože často existuje mnoho základních faktorů přispívajících ke komplexní proměnné, jako je GPA. I když jedna proměnná souvisí s jinou, může to být způsobeno třetí proměnnou ovlivňující obě z nich nebo nepřímými vazbami mezi těmito dvěma proměnnými.

velká velikost vzorku může také silně ovlivnit statistickou významnost korelačního koeficientu tím, že se velmi malé korelační koeficienty zdají významné.

velikost efektu

statisticky významný výsledek nemusí nutně znamenat, že existují důležité aplikace v reálném životě nebo klinické výsledky pro zjištění.

naproti tomu velikost efektu ukazuje praktický význam vašich výsledků. Je důležité hlásit velikosti efektů spolu s inferenciálními statistikami, abyste získali úplný obraz o svých výsledcích. Pokud píšete papír ve stylu APA, měli byste také nahlásit intervalové odhady velikostí efektů.

  • experimentální
  • korelační
příklad: velikost efektu (experiment)
vypočítáte Cohenovo d, abyste zjistili velikost rozdílu mezi skóre pretest a posttest.

s Cohenovým d z 0.72, pro vaše zjištění, že meditační cvičení zlepšilo výsledky testů, je střední až vysoký praktický význam.

příklad: velikost efektu (korelační studie)
Chcete-li určit velikost efektu korelačního koeficientu, porovnáte Pearsonovu hodnotu r S cohenovými kritérii velikosti efektu.

protože vaše hodnota je mezi 0,1 a 0,3, vaše zjištění vztahu mezi rodičovským příjmem a GPA představuje velmi malý efekt a má omezený praktický význam.

chyby rozhodnutí

chyby typu I a typu II jsou chyby učiněné v závěrech výzkumu. Chyba typu I znamená odmítnutí nulové hypotézy, když je skutečně pravdivá, zatímco chyba typu II znamená odmítnutí nulové hypotézy, když je nepravdivá.

můžete se snažit minimalizovat riziko těchto chyb výběrem optimální úrovně významnosti a zajištěním vysokého výkonu. Mezi těmito dvěma chybami je však kompromis, takže je nutná jemná rovnováha.

Frequentistická versus Bayesovská statistika

tradičně frequentistická statistika zdůrazňuje testování významnosti nulové hypotézy a vždy začíná předpokladem skutečné nulové hypotézy.

nicméně, Bayesovská statistika rostla v popularitě jako alternativní přístup v posledních několika desetiletích. V tomto přístupu používáte předchozí výzkum k neustálé aktualizaci svých hypotéz na základě vašich očekávání a pozorování.

Bayesův faktor porovnává relativní sílu důkazů pro nulovou versus alternativní hypotézu spíše než k závěru o odmítnutí nulové hypotézy nebo ne.

Nejčastější dotazy týkající se statistické analýzy

co je statistická analýza?

Statistická analýza je hlavní metodou analýzy kvantitativních výzkumných dat. Používá pravděpodobnosti a modely k testování předpovědí o populaci ze vzorových dat.

jaký je rozdíl mezi popisnou a inferenční statistikou?

Popisná statistika shrnuje Vlastnosti datové sady. Inferenční statistiky umožňují otestovat hypotézu nebo posoudit, zda jsou vaše data zobecnitelná pro širší populaci.

co je testování hypotéz?

testování hypotéz je formální postup pro zkoumání našich představ o světě pomocí statistik. Vědci jej používají k testování konkrétních předpovědí, nazývaných hypotézy, výpočtem, jak je pravděpodobné, že by náhodou mohl vzniknout vzorec nebo vztah mezi proměnnými.

co jsou nulové a alternativní hypotézy?

při testování statistických hypotéz nulová hypotéza testu vždy předpovídá žádný účinek nebo žádný vztah mezi proměnnými, zatímco alternativní hypotéza uvádí vaši výzkumnou předpověď efektu nebo vztahu.

co je statistická významnost?

statistická významnost je termín používaný výzkumníky k tvrzení, že je nepravděpodobné, že by k jejich pozorování mohlo dojít podle nulové hypotézy statistického testu. Významnost je obvykle označována hodnotou p nebo hodnotou pravděpodobnosti.

statistická významnost je libovolná-záleží na prahové hodnotě nebo alfa hodnotě zvolené výzkumným pracovníkem. Nejběžnější prahová hodnota je p < 0,05, což znamená, že data se pravděpodobně vyskytnou méně než 5% času podle nulové hypotézy.

když hodnota p klesne pod zvolenou hodnotu alfa, pak říkáme, že výsledek testu je statisticky významný.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.