teorie za hodnotami p a nulovou hypotézou se může zpočátku zdát komplikovaná, ale pochopení konceptů vám pomůže orientovat se ve světě statistik. Bohužel, tyto pojmy jsou často zneužívány v populární vědě, takže by bylo užitečné, aby každý pochopil základy.
výpočet hodnoty P modelu a prokázání / vyvrácení nulové hypotézy je s MS Excel překvapivě jednoduché. Existují dva způsoby, jak to udělat, a pokryjeme je oba. Pojďme se do toho ponořit.
nulová hypotéza a p-hodnota
nulová hypotéza je tvrzení, označované také jako výchozí pozice, která tvrdí, že vztah mezi pozorovanými jevy neexistuje. Může být také aplikován na asociace mezi dvěma pozorovanými skupinami. Během výzkumu tuto hypotézu otestujete a pokusíte se ji vyvrátit.
například řekněte, že chcete sledovat, zda má určitá strava významné výsledky. Nulová hypotéza v tomto případě spočívá v tom, že neexistuje významný rozdíl v hmotnosti testovaných subjektů před a po dietě. Alternativní hypotéza je, že strava udělala rozdíl. To by se vědci pokusili dokázat.
hodnota p představuje šanci, že statistický souhrn bude roven nebo větší než pozorovaná hodnota, pokud je nulová hypotéza pravdivá pro určitý statistický model. Ačkoli to je často vyjádřeno jako desetinné číslo, je obecně lepší vyjádřit to jako procento. Například hodnota P 0,1 by měla být reprezentována jako 10%.
nízká hodnota p znamená, že důkazy proti nulové hypotéze jsou silné. To dále znamená, že Vaše data jsou významná. Na druhou stranu, vysoká hodnota p znamená, že neexistují žádné silné důkazy proti hypotéze. Aby dokázali, že dieta fad funguje, vědci by museli najít nízkou hodnotu p.
statisticky významný výsledek je ten, který je vysoce nepravděpodobný, pokud je nulová hypotéza pravdivá. Úroveň významnosti je označena řeckým písmenem alfa a musí být větší než hodnota p, aby byl výsledek statisticky významný.
mnoho vědců v široké škále oborů používá hodnotu p, aby získali lepší a hlubší vhled do dat, se kterými pracují. Mezi prominentní oblasti patří sociologie, trestní soudnictví, psychologie, finance, a ekonomie.
nalezení hodnoty p v aplikaci Excel 2010
hodnotu p sady dat v aplikaci MS Excel najdete pomocí funkce T-Test nebo pomocí nástroje pro analýzu dat. Nejprve se podíváme na funkci t-testu. Budeme zkoumat pět vysokoškoláků, kteří šli na 30denní dietu. Porovnáme jejich hmotnost před a po dietě.
poznámka: pro účely tohoto článku jej rozdělíme na MS Excel 2010 a 2016. Ačkoli by se tyto kroky měly obecně vztahovat na všechny verze, rozložení nabídek a podobně se bude lišit.
funkce T-testu
pro výpočet hodnoty p pomocí funkce T-testu postupujte takto.
- vytvořit a naplnit tabulku. Náš stůl vypadá takto:
- klikněte na libovolnou buňku mimo stůl.
- zadejte: = T. Test(.
- za otevřenou závorku zadejte první argument. V tomto příkladu je to sloupec před dietou. Rozsah by měl být B2: B6. Zatím funkce vypadá takto: T. Test (B2: B6.
- dále vstoupíme do druhého argumentu. Sloupec po dietě a jeho výsledky jsou naším druhým argumentem a rozsah, který potřebujeme, je C2: C6. Přidejte jej do vzorce: T. Test(B2: B6, C2: C6.
- za druhý argument zadejte čárku a v rozevírací nabídce se automaticky zobrazí možnosti distribuce s jedním a dvěma ocasem. Pojďme si vybrat první jednoocasou distribuci. Poklepejte na něj.
- zadejte další čárku.
- Poklepejte na možnost spárované v další rozevírací nabídce.
- Nyní, když máte všechny prvky, které potřebujete, zavřete držák. Vzorec pro tento příklad vypadá takto: = T. Test(B2: B6, C2: C6,1,1)
- stiskněte klávesu Enter. Buňka okamžitě zobrazí hodnotu p. V našem případě je hodnota 0,133905569 nebo 13,3905569%.
je vyšší než 5%, tato hodnota p neposkytuje silný důkaz proti nulové hypotéze. V našem příkladu výzkum neprokázal, že dieta pomohla testovaným subjektům ztratit značné množství váhy. To nutně neznamená, že nulová hypotéza je správná, pouze to, že ještě nebyla vyvrácena.
trasa analýzy dat
nástroj pro analýzu dat vám umožňuje provádět mnoho skvělých věcí, včetně výpočtů hodnoty p. Abychom to zjednodušili, použijeme stejnou tabulku jako v předchozí metodě.
takto se to dělá.
- protože již máme hmotnostní rozdíly ve sloupci D, přeskočíme výpočet rozdílu. Pro budoucí tabulky použijte tento vzorec: =“buňka 1″- „buňka 2“.
- dále klikněte na kartu Data v hlavní nabídce.
- vyberte nástroj pro analýzu dat.
- Přejděte dolů v seznamu a klikněte na t-Test: spárované Dva vzorky pro prostředky volba.
- klikněte na OK.
- objeví se vyskakovací okno. Vypadá to takto:
- zadejte první rozsah / argument. V našem příkladu je to B2: B6.
- zadejte druhý rozsah / argument. V tomto případě je to C2: C6.
- ponechte výchozí hodnotu v textovém poli Alfa (je to 0,05).
- klikněte na přepínač Výstupní rozsah a vyberte, kam chcete výsledek. Pokud je to buňka A8, zadejte: $a$8.
- klikněte na OK.
- Excel vypočítá hodnotu p a několik dalších parametrů. Konečná tabulka může vypadat takto:
jak vidíte, hodnota P s jedním ocasem je stejná jako v prvním případě – 0.133905569. Protože je nad 0.05 platí pro tuto tabulku nulová hypotéza a důkazy proti ní jsou slabé.
nalezení hodnoty p v aplikaci Excel 2016
podobně jako výše uvedené kroky pokryjeme výpočet hodnoty p v aplikaci Excel 2016.
- budeme používat stejný příklad jako výše, takže vytvořte tabulku, pokud chcete následovat.
- nyní, v buňce A8, type =T. Test(B2: B6, C2:C6
- dále v buňce A8 zadejte čárku za C6 a poté vyberte jednoocasou distribuci.
- poté zadejte další čárku a vyberte spárované.
- rovnice by nyní měla být =T. Test(B2:B6, C2: C6, 1, 1).
- nakonec stiskněte klávesu Enter pro zobrazení výsledku.
výsledky se mohou lišit o několik desetinných míst v závislosti na vašem nastavení a dostupném prostoru na obrazovce.
co je třeba vědět o hodnotě p
zde je několik užitečných tipů týkajících se výpočtů hodnoty p v aplikaci Excel.
- pokud je hodnota p rovna 0,05 (5%), jsou údaje ve vaší tabulce významné. Pokud je menší než 0.05 (5%), údaje, které máte, jsou velmi významné.
- v případě, že je hodnota p vyšší než 0,1 (10%), jsou údaje ve vaší tabulce nevýznamné. Pokud je to v rozsahu 0.05-0.10, máte okrajově významná data.
- můžete změnit hodnotu alfa, ačkoli nejběžnější možnosti jsou 0,05 (5%) a 0,10 (10%).
- výběr dvouocasého testování může být lepší volbou v závislosti na vaší hypotéze. Ve výše uvedeném příkladu jednoocasé testování znamená, že zkoumáme, zda testované subjekty po dietě zhubly, a to je přesně to, co jsme potřebovali zjistit. Ale dvouocasý test by také zkoumal, zda získali statisticky významné množství váhy.
- hodnota p nemůže identifikovat proměnné. Jinými slovy, pokud identifikuje korelaci, nemůže identifikovat příčiny za tím.
Demystifikovaná hodnota p
každý statistik, který stojí za svou sůl, musí znát vstupy a výstupy testování nulových hypotéz a co znamená hodnota p. Tyto znalosti se také hodí pro výzkumné pracovníky v mnoha dalších oborech.