teoria stojąca za wartościami p i hipotezą zerową może początkowo wydawać się skomplikowana, ale zrozumienie pojęć pomoże Ci poruszać się po świecie statystyki. Niestety, terminy te są często nadużywane w naukach popularnonaukowych, więc byłoby przydatne dla wszystkich, aby zrozumieć podstawy.
obliczanie wartości p modelu i udowodnienie / obalenie hipotezy zerowej jest zaskakująco proste w MS Excel. Są na to dwa sposoby i zajmiemy się nimi. Wkopmy się.
hipoteza zerowa i wartość p
hipoteza zerowa jest stwierdzenie, określane również jako domyślnej pozycji, która twierdzi, że związek między obserwowanymi zjawiskami nie istnieje. Może być również stosowany do skojarzeń między dwiema obserwowanymi grupami. Podczas badań testujesz tę hipotezę i próbujesz ją obalić.
na przykład powiedz, że chcesz obserwować, czy dana dieta modna ma znaczące wyniki. Hipoteza zerowa, w tym przypadku, jest to, że nie ma znaczącej różnicy w masie badanych przed i po diecie. Alternatywną hipotezą jest to, że dieta zrobiła różnicę. To właśnie naukowcy spróbują udowodnić.
wartość p oznacza szansę, że podsumowanie statystyczne będzie równe lub większe od obserwowanej wartości, gdy hipoteza zerowa jest prawdziwa dla pewnego modelu statystycznego. Chociaż często jest wyrażana jako liczba dziesiętna, na ogół lepiej jest wyrazić ją w procentach. Na przykład wartość p 0, 1 powinna być reprezentowana jako 10%.
niska wartość p oznacza, że dowody przeciwko hipotezie zerowej jest silny. Oznacza to również, że Twoje dane są istotne. Z drugiej strony, wysoka wartość p oznacza, że nie ma mocnych dowodów przeciwko tej hipotezie. Aby udowodnić, że dieta Moda działa, naukowcy musieliby znaleźć niską wartość P.
statystycznie istotny wynik jest taki, który jest bardzo mało prawdopodobne, aby się stało, jeśli hipoteza zerowa jest prawdziwa. Poziom istotności jest oznaczony grecką literą alfa i musi być większy niż wartość p, aby wynik był statystycznie istotny.
wielu badaczy z różnych dziedzin wykorzystuje wartość p, aby uzyskać lepszy i głębszy wgląd w dane, z którymi pracują. Niektóre z najważniejszych dziedzin obejmują socjologię, wymiar sprawiedliwości, psychologię, Finanse i ekonomię.
znajdowanie wartości p w programie Excel 2010
wartość p zbioru danych w programie MS Excel można znaleźć za pomocą funkcji t-Test lub za pomocą narzędzia do analizy danych. Najpierw przyjrzymy się funkcji t-Test. Zbadamy pięciu studentów, którzy przeszli 30-dniową dietę. Porównamy ich wagę przed i po diecie.
uwaga: na potrzeby tego artykułu podzielimy go na MS Excel 2010 i 2016. Chociaż kroki powinny zasadniczo dotyczyć wszystkich wersji, układ menu i inne będą się różnić.
funkcja t-Test
wykonaj poniższe kroki, aby obliczyć wartość p za pomocą funkcji t-Test.
- Utwórz i zapełnij tabelę. Nasz stół wygląda tak:
- kliknij dowolną komórkę poza tabelą.
- wpisz: = T. Test(.
- po otwartym nawiasie wpisz pierwszy argument. W tym przykładzie jest to kolumna przed dietą. Zakres powinien wynosić B2: B6. Do tej pory funkcja wygląda następująco: T. Test(B2:B6.
- następnie wprowadzimy drugi argument. Kolumna po diecie i jej wyniki są naszym drugim argumentem, a zakres, którego potrzebujemy, to C2: C6. Dodajmy go do wzoru: T. Test (B2: B6, C2: C6.
- wpisz przecinek po drugim argumencie, a opcje dystrybucji jedno-i dwu-stronnej pojawią się automatycznie w rozwijanym menu. Wybierzmy rozkład pierwszy-jeden ogon. Kliknij dwukrotnie.
- wpisz kolejny przecinek.
- Kliknij dwukrotnie opcję sparowaną w następnym rozwijanym menu.
- teraz, gdy masz wszystkie potrzebne elementy, Zamknij wspornik. Wzór dla tego przykładu wygląda następująco: = T. Test(B2:B6,C2: C6,1,1)
- naciśnij Enter. Komórka natychmiast wyświetli wartość P. W naszym przypadku wartość wynosi 0.133905569 lub 13.3905569%.
jest wyższa niż 5%, ta wartość p nie dostarcza mocnych dowodów przeciwko hipotezie zerowej. W naszym przykładzie badania nie dowiodły, że dieta pomogła testerom stracić znaczną wagę. Nie musi to oznaczać, że hipoteza zerowa jest poprawna, tylko, że nie została jeszcze obalona.
trasa analizy danych
narzędzie do analizy danych umożliwia wykonywanie wielu ciekawych rzeczy, w tym obliczeń wartości P. Aby uprościć sprawę, użyjemy tej samej tabeli, co w poprzedniej metodzie.
oto jak to się robi.
- ponieważ mamy już różnice wagowe w kolumnie D, pominiemy obliczanie różnicy. Dla przyszłych tabel, użyj tej formuły: = „Cell 1” – „Cell 2”.
- następnie kliknij kartę Dane w menu głównym.
- wybierz narzędzie do analizy danych.
- Przewiń listę w dół i kliknij opcję T-Test: sparowane dwie próbki dla środków.
- kliknij OK.
- pojawi się wyskakujące okno. Wygląda to tak:
- wprowadź pierwszy zakres / argument. W naszym przykładzie jest to B2: B6.
- wprowadź drugi zakres / argument. W tym przypadku jest to C2: C6.
- pozostaw domyślną wartość w polu tekstowym Alfa (jest to 0.05).
- kliknij przycisk radiowy zakres wyjściowy i wybierz miejsce, w którym chcesz uzyskać wynik. Jeśli jest to komórka A8, wpisz: $a$8.
- kliknij OK.
- Excel obliczy wartość p i kilka innych parametrów. Tabela końcowa może wyglądać tak:
jak widać, wartość P z jednym ogonem jest taka sama jak w pierwszym przypadku – 0,133905569. Ponieważ jest powyżej 0.05, hipoteza zerowa dotyczy tej tabeli, a dowody przeciwko niej są słabe.
znajdowanie wartości p w programie Excel 2016
podobnie jak w powyższych krokach, omówmy obliczenie wartości p w programie Excel 2016.
- będziemy używać tego samego przykładu, co powyżej, więc utwórz tabelę, jeśli chcesz podążać dalej.
- teraz, w komórce A8, wpisz = T. Test(B2:B6, C2:C6
- następnie, w komórce A8, wprowadź przecinek po C6, a następnie wybierz rozkład jednostajny.
- następnie wprowadź inny przecinek i wybierz sparowane.
- równanie powinno być teraz =T. Test(B2:B6, C2:C6,1,1).
- na koniec naciśnij klawisz Enter, aby wyświetlić wynik.
wyniki mogą się różnić o kilka miejsc po przecinku w zależności od ustawień i dostępnego miejsca na ekranie.
warto wiedzieć o wartości p
oto kilka przydatnych wskazówek dotyczących obliczeń wartości p w Excelu.
- jeśli wartość p jest równa 0, 05 (5%), DANE w tabeli są znaczące. Jeśli jest mniejsza niż 0.05 (5%), Dane, które posiadasz, są bardzo istotne.
- w przypadku, gdy wartość p jest większa niż 0, 1 (10%), DANE w tabeli są nieistotne. Jeśli jest w zakresie 0.05-0.10, masz marginalnie istotne dane.
- możesz zmienić wartość alfa, chociaż najczęstsze opcje to 0.05 (5%) i 0.10 (10%).
- wybór testu dwuogonowego może być lepszym wyborem, w zależności od twojej hipotezy. W powyższym przykładzie test z jednym ogonem oznacza, że badamy, czy badani schudli po diecie i dokładnie tego potrzebowaliśmy, aby się dowiedzieć. Ale test dwuogonowy zbadałby również, czy uzyskali statystycznie istotne ilości wagi.
- wartość p nie może zidentyfikować zmiennych. Innymi słowy, jeśli identyfikuje korelację, nie może zidentyfikować przyczyn leżących za nią.
wartość P Demystified
każdy statystyk wart swojej soli musi znać tajniki testowania hipotezy zerowej i co oznacza wartość P. Wiedza ta przyda się również badaczom z wielu innych dziedzin.