Die Theorie hinter den p-Werten und der Nullhypothese mag zunächst kompliziert erscheinen, aber das Verständnis der Konzepte wird Ihnen helfen, sich in der Welt der Statistik zurechtzufinden. Leider werden diese Begriffe in der Populärwissenschaft oft missbraucht, daher wäre es für jeden nützlich, die Grundlagen zu verstehen.
Mit MS Excel ist es überraschend einfach, den p-Wert eines Modells zu berechnen und die Nullhypothese zu beweisen / zu widerlegen. Es gibt zwei Möglichkeiten, dies zu tun, und wir werden beide behandeln. Lass uns graben.
Nullhypothese und p-Wert
Die Nullhypothese ist eine Aussage, die auch als Standardposition bezeichnet wird und behauptet, dass die Beziehung zwischen den beobachteten Phänomenen nicht existiert. Es kann auch auf Assoziationen zwischen zwei beobachteten Gruppen angewendet werden. Während der Forschung testen Sie diese Hypothese und versuchen, sie zu widerlegen.
Angenommen, Sie möchten beobachten, ob eine bestimmte Modediät signifikante Ergebnisse liefert. Die Nullhypothese ist in diesem Fall, dass es keinen signifikanten Unterschied im Gewicht der Testpersonen vor und nach einer Diät gibt. Die alternative Hypothese ist, dass die Ernährung einen Unterschied gemacht hat. Dies würden Forscher versuchen zu beweisen.
Der p-Wert stellt die Wahrscheinlichkeit dar, dass die statistische Zusammenfassung gleich oder größer als der beobachtete Wert ist, wenn die Nullhypothese für ein bestimmtes statistisches Modell zutrifft. Obwohl es oft als Dezimalzahl ausgedrückt wird, ist es im Allgemeinen besser, es als Prozentsatz auszudrücken. Zum Beispiel sollte der p-Wert von 0,1 als 10% dargestellt werden.
Ein niedriger p-Wert bedeutet, dass die Beweise gegen die Nullhypothese stark sind. Dies bedeutet weiter, dass Ihre Daten von Bedeutung sind. Andererseits bedeutet ein hoher p-Wert, dass es keine starken Beweise gegen die Hypothese gibt. Um zu beweisen, dass die Modediät funktioniert, müssten die Forscher einen niedrigen p-Wert finden.
Ein statistisch signifikantes Ergebnis ist dasjenige, das höchst unwahrscheinlich ist, wenn die Nullhypothese wahr ist. Das Signifikanzniveau wird mit dem griechischen Buchstaben alpha bezeichnet und muss größer als der p-Wert sein, damit das Ergebnis statistisch signifikant ist.
Viele Forscher in einer Vielzahl von Bereichen verwenden den p-Wert, um einen besseren und tieferen Einblick in die Daten zu erhalten, mit denen sie arbeiten. Einige der prominenten Bereiche sind Soziologie, Strafjustiz, Psychologie, Finanzen und Wirtschaft.
Ermitteln des p-Werts in Excel 2010
Sie können den p-Wert eines Datensatzes in MS Excel über die T-Test-Funktion oder mit dem Datenanalysetool ermitteln. Zuerst schauen wir uns die T-Test-Funktion an. Wir werden fünf Studenten untersuchen, die eine 30-tägige Diät gemacht haben. Wir vergleichen ihr Gewicht vor und nach der Diät.
HINWEIS: Für die Zwecke dieses Artikels teilen wir es in MS Excel 2010 und 2016 auf. Obwohl die Schritte im Allgemeinen für alle Versionen gelten sollten, unterscheidet sich das Layout der Menüs und so weiter.
T-Testfunktion
Gehen Sie folgendermaßen vor, um den p-Wert mit der T-Testfunktion zu berechnen.
- Erstellen und füllen Sie die Tabelle. Unser Tisch sieht so aus:
- Klicken Sie auf eine beliebige Zelle außerhalb Ihrer Tabelle.
- Geben Sie ein: =T.Test(.
- Geben Sie nach der offenen Klammer das erste Argument ein. In diesem Beispiel ist es die Spalte Vor der Diät. Der Bereich sollte B2: B6 sein. Bisher sieht die Funktion so aus: T.Test(B2:B6.
- Als nächstes geben wir das zweite Argument ein. Die After-Diät-Spalte und ihre Ergebnisse sind unser zweites Argument und der Bereich, den wir benötigen, ist C2: C6. Fügen wir es der Formel hinzu: T.Test(B2:B6, C2:C6.
- Geben Sie nach dem zweiten Argument ein Komma ein, und die Optionen einseitige Verteilung und zweiseitige Verteilung werden automatisch in einem Dropdown-Menü angezeigt. Lassen Sie uns die erste auswählen – einseitige Verteilung. Doppelklicken Sie darauf.
- Geben Sie ein anderes Komma ein.
- Doppelklicken Sie im nächsten Dropdown-Menü auf die Option Gepaart.
- Nachdem Sie alle Elemente haben, die Sie benötigen, schließen Sie die Halterung. Die Formel für dieses Beispiel sieht folgendermaßen aus: =T.Test(B2:B6, C2: C6,1,1)
- Drücken Sie die Eingabetaste. Die Zelle zeigt den p-Wert sofort an. In unserem Fall ist der Wert 0,133905569 oder 13,3905569%.
Da dieser p-Wert höher als 5% ist, liefert er keine starken Beweise gegen die Nullhypothese. In unserem Beispiel hat die Forschung nicht bewiesen, dass Diäten den Testpersonen geholfen haben, eine signifikante Menge an Gewicht zu verlieren. Dies bedeutet nicht unbedingt, dass die Nullhypothese korrekt ist, nur dass sie noch nicht widerlegt wurde.
Datenanalyse-Route
Mit dem Datenanalyse-Tool können Sie viele coole Dinge tun, einschließlich p-Wert-Berechnungen. Um die Dinge einfacher zu machen, verwenden wir dieselbe Tabelle wie in der vorherigen Methode.
Hier ist, wie es gemacht wird.
- Da wir die Gewichtsdifferenzen bereits in der Spalte D haben, überspringen wir die Differenzberechnung. Verwenden Sie für die zukünftigen Tabellen diese Formel: =“Zelle 1″-„Zelle 2“.
- Klicken Sie anschließend im Hauptmenü auf die Registerkarte Daten.
- Wählen Sie das Datenanalyse-Tool aus.
- Scrollen Sie in der Liste nach unten und klicken Sie auf die Option t-Test: Paired Two Sample for Means.
- Klicken Sie auf OK.
- Ein Popup-Fenster wird angezeigt. Es sieht so aus:
- Geben Sie den ersten Bereich / das erste Argument ein. In unserem Beispiel ist es B2: B6.
- Geben Sie den zweiten Bereich / das zweite Argument ein. In diesem Fall ist es C2: C6.
- Belassen Sie den Standardwert im Alpha-Textfeld (es ist 0,05).
- Klicken Sie auf das Optionsfeld Ausgabebereich und wählen Sie aus, wo das Ergebnis angezeigt werden soll. Wenn es sich um die A8-Zelle handelt, geben Sie Folgendes ein: $ A $ 8.
- Klicken Sie auf OK.
- Excel berechnet den p-Wert und mehrere andere Parameter. Der Final Table könnte so aussehen:
Wie Sie sehen, ist der One-Tail-p–Wert derselbe wie im ersten Fall – 0,133905569. Da es über 0 liegt.05 gilt die Nullhypothese für diese Tabelle, und die Beweise dagegen sind schwach.
Ermitteln des p-Werts in Excel 2016
Ähnlich wie in den obigen Schritten behandeln wir die Berechnung des p-Werts in Excel 2016.
- Wir verwenden das gleiche Beispiel wie oben, also erstellen Sie die Tabelle, wenn Sie folgen möchten.
- Geben Sie nun in Zelle A8 =T.Test ein (B2:B6, C2:C6
- Geben Sie als Nächstes in Zelle A8 nach C6 ein Komma ein und wählen Sie dann Einseitige Verteilung aus.
- Geben Sie dann ein weiteres Komma ein und wählen Sie Gepaart.
- Die Gleichung sollte nun =T.Test(B2:B6, C2:C6,1,1) .
- Drücken Sie abschließend die Eingabetaste, um das Ergebnis anzuzeigen.
Die Ergebnisse können um einige Dezimalstellen variieren, abhängig von Ihren Einstellungen und dem verfügbaren Bildschirmbereich.
Wissenswertes über den p-Wert
Hier sind einige nützliche Tipps zu p-Wert-Berechnungen in Excel.
- Wenn der p-Wert gleich 0,05 (5%) ist, sind die Daten in der Tabelle signifikant. Wenn es kleiner als 0 ist.05 (5%), die Daten, die Sie haben, sind sehr wichtig.
- Wenn der p-Wert mehr als 0,1 (10%) beträgt, sind die Daten in Ihrer Tabelle unbedeutend. Wenn es im Bereich von 0,05-0,10 liegt, haben Sie marginal signifikante Daten.
- Sie können den Alpha-Wert ändern, obwohl die häufigsten Optionen 0,05 (5%) und 0,10 (10%) sind.
- Je nach Hypothese kann die Wahl eines zweischwänzigen Tests die bessere Wahl sein. Im obigen Beispiel bedeutet One-Tailed-Test, dass wir untersuchen, ob die Testpersonen nach einer Diät an Gewicht verloren haben, und genau das mussten wir herausfinden. Ein zweischwänziger Test würde jedoch auch untersuchen, ob sie statistisch signifikant an Gewicht zugenommen haben.
- Der p-Wert kann Variablen nicht identifizieren. Mit anderen Worten, wenn es eine Korrelation identifiziert, kann es die Ursachen dahinter nicht identifizieren.
Der p-Wert entmystifiziert
Jeder Statistiker, der sein Salz wert ist, muss die Besonderheiten des Nullhypothesentests kennen und wissen, was der p-Wert bedeutet. Dieses Wissen wird auch Forschern in vielen anderen Bereichen von Nutzen sein.