de theorie achter p-waarden en de nulhypothese lijkt in het begin misschien ingewikkeld, maar het begrijpen van de concepten zal u helpen door de wereld van de statistieken te navigeren. Helaas worden deze termen vaak misbruikt in de populaire wetenschap, dus het zou nuttig zijn voor iedereen om de basis te begrijpen.
het berekenen van de p-waarde van een model en het bewijzen/weerleggen van de nulhypothese is verrassend eenvoudig met MS Excel. Er zijn twee manieren om het te doen en we behandelen ze allebei. Laten we gaan graven.
nulhypothese en p-waarde
de nulhypothese is een statement, ook wel een standaardpositie genoemd, dat beweert dat de relatie tussen de waargenomen verschijnselen niet bestaat. Het kan ook worden toegepast op associaties tussen twee waargenomen groepen. Tijdens het onderzoek test je deze hypothese en probeer je het te weerleggen.
stel bijvoorbeeld dat u wilt observeren of een bepaald ragedieet significante resultaten heeft. De nulhypothese is in dit geval dat er geen significant verschil is in het gewicht van de proefpersonen voor en na een dieet. De alternatieve hypothese is dat het dieet een verschil maakte. Dit is wat onderzoekers zouden proberen te bewijzen.
de p-waarde is de kans dat de statistische samenvatting gelijk is aan of groter is dan de waargenomen waarde wanneer de nulhypothese waar is voor een bepaald statistisch model. Hoewel het vaak wordt uitgedrukt als een decimaal getal, is het over het algemeen beter om het uit te drukken als een percentage. Bijvoorbeeld, de p-waarde van 0,1 moet worden weergegeven als 10%.
een lage p-waarde betekent dat het bewijs tegen de nulhypothese sterk is. Dit betekent verder dat uw gegevens significant zijn. Aan de andere kant betekent een hoge p-waarde dat er geen sterk bewijs is tegen de hypothese. Om te bewijzen dat de rage dieet werkt, onderzoekers zou moeten vinden van een lage p-waarde.
een statistisch significant resultaat is het resultaat dat hoogst onwaarschijnlijk is als de nulhypothese waar is. Het significantieniveau wordt aangeduid met de Griekse letter alfa en het moet groter zijn dan de p-waarde om het resultaat statistisch significant te laten zijn.
veel onderzoekers in een breed scala van gebieden gebruiken de p-waarde om een beter en dieper inzicht te krijgen in de gegevens waarmee ze werken. Enkele van de prominente gebieden zijn sociologie, strafrecht, psychologie, financiën en economie.
het vinden van de p-waarde in Excel 2010
u kunt de p-waarde van een gegevensset in MS Excel vinden via de T-Test functie of met behulp van de Data Analysis tool. Eerst kijken we naar de T-testfunctie. We onderzoeken vijf studenten die 30 dagen op dieet waren. We vergelijken hun gewicht voor en na het dieet.
opmerking: voor de toepassing van dit artikel splitsen we het op in MS Excel 2010 en 2016. Hoewel de stappen over het algemeen van toepassing moeten zijn op alle versies, zal de lay-out van de menu ‘ s en wat al niet verschillen.
T-testfunctie
volg deze stappen om de p-waarde met de T-testfunctie te berekenen.
- maak en vul de tabel aan. Onze tafel ziet er zo uit:
- klik op een cel buiten uw tabel.
- Type in: = T. Test(.
- typ na het openen van de haakje het eerste argument in. In dit voorbeeld is het de kolom voor dieet. Het bereik moet B2:B6 zijn. Tot nu toe ziet de functie er als volgt uit: T. Test (B2: B6.
- vervolgens voeren we het tweede argument in. De kolom na dieet en de resultaten zijn ons tweede argument en het bereik dat we nodig hebben is C2:C6. Laten we het toevoegen aan de formule: T. Test (B2: B6, C2: C6.
- Typ in een komma na het tweede argument en de eenzijdige distributie en tweestaart distributie opties zullen automatisch verschijnen in een drop-down menu. Laten we de eerste – één-staart distributie kiezen. Dubbelklik erop.
- typ een andere komma in.
- Dubbelklik op de gekoppelde optie in het volgende drop-down menu.
- nu je alle elementen hebt die je nodig hebt, sluit je de beugel. De formule voor dit voorbeeld ziet er als volgt uit: =T. Test(B2:B6,C2: C6,1,1)
- druk op Enter. De cel geeft de p-waarde onmiddellijk weer. In ons geval is de waarde 0,133905569 of 13.3905569%.
deze p-waarde is hoger dan 5% en levert geen sterk bewijs tegen de nulhypothese. In ons voorbeeld heeft het onderzoek niet bewezen dat een dieet de proefpersonen hielp een aanzienlijke hoeveelheid gewicht te verliezen. Dit betekent niet noodzakelijk dat de nulhypothese correct is, alleen dat deze nog niet is weerlegd.
Data Analysis Route
met de Data Analysis tool kunt u veel coole dingen doen, waaronder p-waarde berekeningen. Om het eenvoudiger te maken, gebruiken we dezelfde tabel als in de vorige methode.
Dit is hoe het moet.
- omdat we al de gewichtsverschillen in de kolom D hebben, slaan we de berekening van het verschil over. Gebruik voor de toekomstige tabellen deze formule: = “Cell 1” – “Cell 2”.
- klik vervolgens op het tabblad Data in het hoofdmenu.
- Selecteer de Data Analysis tool.
- Scroll naar beneden in de lijst en klik op de T-Test: gepaarde twee monster voor middelen optie.
- klik op OK.
- er verschijnt een pop-upvenster. Het ziet er zo uit:
- voer het eerste bereik/argument in. In ons voorbeeld is het B2: B6.
- voer het tweede bereik / argument in. In dit geval is het C2: C6.
- laat de standaard waarde in het Alpha tekstvak (het is 0.05).
- klik op de keuzerondje Uitvoerbereik en kies waar u het resultaat wilt. Als het de A8 cel is, typ dan in: $a$8.
- klik op OK.
- Excel berekent de p-waarde en verschillende andere parameters. De finaletafel zou er zo uit kunnen zien:
zoals u kunt zien, is de één-staart p-waarde hetzelfde als in het eerste geval – 0.133905569. Omdat het boven 0 is.05, de nulhypothese geldt voor deze tabel, en het bewijs tegen het is zwak.
het vinden van de p-waarde in Excel 2016
vergelijkbaar met de bovenstaande stappen, laten we de berekening van de p-waarde in Excel 2016 behandelen.
- we gebruiken hetzelfde voorbeeld als hierboven, dus maak de tabel aan als je wilt volgen.
- nu, in cel A8, type = T. Test (B2: B6, C2: C6
- voer vervolgens in cel A8 een komma na C6 in en selecteer vervolgens eenzijdige distributie.
- voer vervolgens een andere komma in en selecteer gekoppeld.
- de vergelijking moet nu =T. Test zijn (B2: B6, C2: C6,1,1).
- tenslotte drukt u op Enter om het resultaat weer te geven.
de resultaten kunnen variëren met een paar decimalen, afhankelijk van uw instellingen en beschikbare schermruimte.
wat u moet weten over de p-waarde
hier zijn enkele nuttige tips voor P-waardeberekeningen in Excel.
- als de p-waarde gelijk is aan 0,05 (5%), zijn de gegevens in uw tabel significant. Als het minder dan 0 is.05 (5%), de gegevens die u heeft zijn zeer significant.
- indien de p-waarde groter is dan 0,1 (10%), zijn de gegevens in uw tabel onbeduidend. Als het in de 0,05-0,10 bereik is, heb je marginaal significante gegevens.
- u kunt de alfa-waarde wijzigen, hoewel de meest voorkomende opties 0,05 (5%) en 0,10 (10%) zijn.
- het kiezen van twee-tailed testing kan de betere keuze zijn, afhankelijk van uw hypothese. In het bovenstaande voorbeeld, one-tailed testing betekent dat we onderzoeken of de proefpersonen gewicht verloren na een dieet, en dat is precies wat we nodig hadden om uit te vinden. Maar een twee-tailed test zou ook onderzoeken of ze statistisch significante hoeveelheden gewicht gewonnen.
- de p-waarde kan geen variabelen identificeren. Met andere woorden, als het een correlatie identificeert, kan het de oorzaken erachter niet identificeren.
de P-waarde gedemystificeerd
elke statisticus die zijn of haar zout waard is, moet de ins en outs van nulhypothese testen kennen en wat de p-waarde betekent. Deze kennis zal ook van pas komen voor onderzoekers op vele andere gebieden.