analiza statystyczna oznacza badanie trendów, wzorców i Relacji z wykorzystaniem danych ilościowych. Jest ważnym narzędziem badawczym używanym przez naukowców, rządy, firmy i inne organizacje.

aby wyciągnąć prawidłowe wnioski, analiza statystyczna wymaga starannego planowania od samego początku procesu badawczego. Musisz określić swoje hipotezy i podjąć decyzje dotyczące projektu badawczego, wielkości próbki i procedury pobierania próbek.

po zebraniu danych z próbki można organizować i podsumowywać dane za pomocą statystyk opisowych. Następnie możesz użyć wnioskujących statystyk, aby formalnie przetestować hipotezy i dokonać szacunków dotyczących populacji. Wreszcie, można interpretować i uogólniać swoje wnioski.

ten artykuł jest praktycznym wprowadzeniem do analizy statystycznej dla studentów i naukowców. Przeprowadzimy Cię przez kroki, korzystając z dwóch przykładów badawczych. Pierwszy bada potencjalną zależność przyczynowo-skutkową, podczas gdy drugi bada potencjalną korelację między zmiennymi.

przykład: pytanie o badania Przyczynowe
czy medytacja może poprawić wydajność egzaminu u nastolatków?
przykład: pytanie dotyczące badań korelacyjnych
czy istnieje związek między dochodem rodziców a średnią ocen w college ’ u (GPA)?

Krok 1: Napisz swoje hipotezy i zaplanuj swój projekt badawczy

aby zebrać poprawne dane do analizy statystycznej, musisz najpierw określić swoje hipotezy i zaplanować swój projekt badawczy.

pisanie hipotez statystycznych

celem badań jest często zbadanie zależności między zmiennymi w populacji. Zaczynasz od prognozy i korzystasz z analizy statystycznej, aby ją przetestować.

hipoteza statystyczna jest formalnym sposobem pisania prognozy o populacji. Każda prognoza badawcza jest przekształcana w hipotezy zerowe i alternatywne, które można przetestować za pomocą przykładowych danych.

podczas gdy hipoteza zerowa zawsze przewiduje brak efektu lub brak relacji między zmiennymi, hipoteza alternatywna stwierdza swoje przewidywania badań efektu lub związku.

przykład: hipotezy statystyczne, aby przetestować efekt
  • hipoteza zerowa: 5-minutowe ćwiczenie medytacyjne nie będzie miało wpływu na wyniki testów matematycznych u nastolatków.
  • hipoteza Alternatywna: 5-minutowe ćwiczenie medytacyjne poprawi wyniki testów matematycznych u nastolatków.
przykład: Hipotezy statystyczne, aby przetestować korelację
  • hipoteza zerowa: dochód rodziców i GPA nie mają ze sobą żadnego związku u studentów.
  • hipoteza Alternatywna: dochód rodziców i GPA są dodatnio skorelowane u studentów.

Planowanie projektu badawczego

projekt badawczy to ogólna strategia gromadzenia i analizy danych. Określa testy statystyczne, których możesz później użyć do przetestowania swojej hipotezy.

najpierw zdecyduj, czy twoje badania będą korzystać z projektu opisowego, korelacyjnego lub eksperymentalnego. Eksperymenty bezpośrednio wpływają na zmienne, podczas gdy badania opisowe i korelacyjne mierzą tylko zmienne.

  • w projekcie eksperymentalnym można ocenić związek przyczynowo-skutkowy (np. wpływ medytacji na wyniki testu) za pomocą statystycznych testów porównawczych lub regresji.
  • w projekcie korelacyjnym można badać relacje między zmiennymi (np., dochód rodziców i GPA) bez żadnego założenia przyczynowości przy użyciu współczynników korelacji i testów istotności.
  • w projekcie opisowym można badać cechy populacji lub zjawiska (np. częstość występowania lęku u amerykańskich studentów) za pomocą testów statystycznych w celu wyciągnięcia wniosków z przykładowych danych.

Twój projekt badawczy dotyczy również tego, czy porównasz uczestników na poziomie grupowym, indywidualnym, czy obu.

  • w projekcie między podmiotami porównujesz wyniki na poziomie grupowym uczestników, którzy byli narażeni na różne zabiegi (np. ci, którzy wykonywali ćwiczenia medytacyjne, vs ci, którzy nie wykonywali).
  • w projekcie wewnątrz przedmiotów porównujesz powtarzane miary uczestników, którzy uczestniczyli we wszystkich zabiegach w badaniu (np. wyniki przed i po wykonaniu ćwiczenia medytacyjnego).
  • Eksperymentalne
  • Korelacyjne
Przykład: Eksperymentalny projekt badawczy
projektujesz eksperyment wewnątrz przedmiotów, aby zbadać, czy 5-minutowe ćwiczenie medytacyjne może poprawić wyniki testów matematycznych. Badanie wykonuje powtarzające się środki z jednej grupy uczestników.

po pierwsze, otrzymasz wyniki testu podstawowego od uczestników. Następnie twoi uczestnicy zostaną poddani 5-minutowemu ćwiczeniu medytacji. Na koniec nagrasz wyniki uczestników z drugiego testu z matematyki.

w tym eksperymencie zmienna niezależna to 5-minutowe ćwiczenie medytacyjne, a zmienna zależna to zmiana wyników testów matematycznych przed i po interwencji.

przykład: korelacyjny projekt badawczy
w badaniu korelacyjnym sprawdzasz, czy istnieje związek między dochodem rodziców a średnią ocen u studentów kończących studia. Aby zebrać swoje dane, poprosisz uczestników o wypełnienie ankiety i samodzielne zgłoszenie dochodów rodziców i własnej GPA.

w tym badaniu nie ma zmiennych zależnych ani niezależnych, ponieważ chcemy mierzyć tylko zmienne, nie wpływając na nie w żaden sposób.

pomiar zmiennych

planując projekt badawczy, należy operować zmienne i zdecydować, jak dokładnie je zmierzyć.

do analizy statystycznej ważne jest, aby wziąć pod uwagę poziom pomiaru zmiennych, który mówi, jakiego rodzaju dane zawierają:

  • dane kategoryczne reprezentują grupy. Mogą być nominalne (np., płeć) lub porządkowy (np. poziom umiejętności językowych).
  • dane ilościowe przedstawiają kwoty. Mogą to być skala interwałowa (np. wynik testu) lub skala proporcji (np. wiek).

wiele zmiennych można zmierzyć z różnymi poziomami precyzji. Na przykład dane dotyczące wieku mogą być ilościowe (8 lat) lub kategoryczne (Młody). Jeśli zmienna jest kodowana numerycznie (np. poziom umowy od 1-5), nie oznacza to automatycznie, że jest ilościowa, a nie kategoryczna.

określenie poziomu pomiaru jest ważne dla wyboru odpowiednich statystyk i testów hipotez. Na przykład można obliczyć średni wynik za pomocą danych ilościowych, ale nie za pomocą danych kategorycznych.

w badaniu badawczym, wraz z pomiarami interesujących Cię zmiennych, często zbierasz dane dotyczące odpowiednich cech uczestników.

  • Eksperymentalne
  • Korelacyjne
Przykład: Zmienne (eksperyment)
możesz wykonywać wiele obliczeń z ilościowymi danymi wieku lub wyniku testu, podczas gdy zmienne kategoryczne mogą być używane do decydowania o grupach do testów porównawczych.

zmienna typ danych
wiek Ilość (stosunek)
płeć kategoryczna (nominalna)
rasa lub pochodzenie etniczne kategoryczne (nominalne)
wyjściowe wyniki badań ilościowe (interwał)
końcowe wyniki testu ilościowe (interwał)
przykład: Zmienne (badanie korelacyjne)
typy zmiennych w badaniu korelacyjnym określają test, którego użyjesz do obliczenia współczynnika korelacji. Dla danych ilościowych można zastosować test korelacji parametrycznej, natomiast jeśli jedna ze zmiennych jest porządkowa, należy zastosować test korelacji nieparametrycznej.

zmienna typ danych
dochody rodziców ilościowe (stosunek)
GPA ilościowe (interwał)

Krok 2: Zbierz dane z próby

 populacja vs próba

populacja vs próbka

w większości przypadków zbieranie danych od każdego członka populacji, którego interesuje badanie, jest zbyt trudne lub kosztowne. Zamiast tego będziesz zbierać dane z próbki.

Analiza statystyczna pozwala na zastosowanie wyników poza własną próbką, o ile stosuje się odpowiednie procedury pobierania próbek. Należy dążyć do próbki, która jest reprezentatywna dla populacji.

pobieranie próbek do analizy statystycznej

istnieją dwa główne podejścia do wyboru próby.

  • próbkowanie prawdopodobieństwa: każdy członek populacji ma szansę być wybrany do badania poprzez wybór losowy.
  • próbkowanie bez prawdopodobieństwa: niektórzy członkowie populacji są bardziej prawdopodobne niż inni, aby zostać wybranym do badania ze względu na kryteria, takie jak wygoda lub dobrowolny self-selection.

w teorii, w przypadku wysoce uogólnionych ustaleń, należy użyć metody próbkowania prawdopodobieństwa. Losowy wybór zmniejsza odchylenie próbkowania i zapewnia, że dane z próbki jest rzeczywiście typowe dla populacji. Testy parametryczne mogą być wykorzystywane do silnych wniosków statystycznych, gdy dane są zbierane za pomocą próbkowania prawdopodobieństwa.

ale w praktyce rzadko jest możliwe zebranie idealnej próbki. Chociaż próbki bez prawdopodobieństwa są bardziej podatne na stronniczość, są one znacznie łatwiejsze do rekrutacji i zbierania danych. Testy nieparametryczne są bardziej odpowiednie dla próbek innych niż prawdopodobieństwo, ale skutkują słabszymi wnioskami na temat populacji.

jeśli chcesz użyć testów parametrycznych dla próbek innych niż prawdopodobieństwo, musisz stwierdzić, że:

  • twoja próbka jest reprezentatywna dla populacji, do której uogólniasz swoje wyniki.
  • twoja próba nie jest systematyczna.

pamiętaj, że zewnętrzna Ważność oznacza, że możesz uogólniać swoje wnioski tylko dla innych, którzy podzielają cechy twojej próbki. Na przykład, wynika z zachodnich, wykształconych, uprzemysłowionych, bogatych i demokratycznych próbek (np., studentów w USA) nie są automatycznie stosowane do wszystkich nie-dziwnych populacji.

jeśli zastosujesz testy parametryczne do danych z próbek innych niż prawdopodobieństwo, pamiętaj, aby rozwinąć ograniczenia dotyczące tego, w jakim stopniu wyniki mogą być uogólnione w sekcji dyskusji.

stwórz odpowiednią procedurę pobierania próbek

na podstawie dostępnych zasobów do badań, zdecyduj, w jaki sposób zrekrutujesz uczestników.

  • czy będziesz miał środki, aby reklamować swoje studia szeroko, w tym poza uczelnią?
  • czy będziesz miał środki, aby zrekrutować zróżnicowaną próbkę, która reprezentuje szeroką populację?
  • czy masz czas na kontakt z członkami trudno dostępnych grup?
  • eksperymentalne
  • korelacyjne
przykład: próbkowanie (eksperyment)
populacja, którą jesteś zainteresowany, to uczniowie szkół średnich w Twoim mieście. Skontaktuj się z trzema szkołami prywatnymi i siedmioma szkołami publicznymi w różnych dzielnicach miasta, aby sprawdzić, czy możesz zarządzać swoim eksperymentem wśród uczniów w 11 klasie.

twoi uczestnicy są wybierani samodzielnie przez swoje szkoły . Chociaż używasz próbki bez prawdopodobieństwa, dążysz do zróżnicowanej i reprezentatywnej próbki.

przykład: pobieranie próbek (badanie korelacyjne)
Twoją główną populacją są mężczyźni studenci w USA. Korzystając z reklam w mediach społecznościowych, rekrutujesz starszych studentów z mniejszej subpopulacji: siedmiu uniwersytetów w rejonie Bostonu.

twoi uczestnicy zgłaszają się do ankiety, dzięki czemu jest to próbka bez prawdopodobieństwa.

Oblicz wystarczającą wielkość próby

przed rekrutacją uczestników zdecyduj o wielkości próby, patrząc na inne badania w swojej dziedzinie lub korzystając ze statystyk. Zbyt mała próbka może być niereprezentatywna próbki, podczas gdy zbyt duża próbka będzie bardziej kosztowna niż to konieczne.

istnieje wiele kalkulatorów wielkości próbek online. Różne formuły są używane w zależności od tego, czy masz podgrupy lub jak rygorystyczne badanie powinno być (np. w badaniach klinicznych). Z reguły konieczne jest minimum 30 jednostek lub więcej na podgrupę.

aby korzystać z tych kalkulatorów, musisz zrozumieć i wprowadzić te kluczowe komponenty:

  • poziom istotności (alpha): ryzyko odrzucenia prawdziwej hipotezy zerowej, że jesteś gotów podjąć, zwykle ustawiony na 5%.
  • Siła statystyczna: prawdopodobieństwo twojego badania wykrycia efektu o określonej wielkości, jeśli taki istnieje, Zwykle 80% lub więcej.
  • oczekiwany rozmiar efektu: standaryzowane wskazanie, jak duży będzie oczekiwany wynik badania, zwykle w oparciu o inne podobne badania.
  • odchylenie standardowe populacji: oszacowanie parametru populacji na podstawie wcześniejszego badania lub własnego badania pilotażowego.

jaki jest Twój wynik plagiatu?

Porównaj swój artykuł z ponad 60 miliardami stron internetowych i 30 milionami publikacji.

  • najlepszy program sprawdzający plagiat w 2021 r.
  • raport o plagiacie & procent
  • największa baza danych o plagiacie

Scribbr program sprawdzający plagiat

Krok 3: Podsumuj dane za pomocą statystyk opisowych

po zebraniu wszystkich danych możesz je sprawdzić i obliczyć statystyki opisowe, które je podsumowują.

Sprawdź swoje dane

istnieją różne sposoby sprawdzania danych, w tym następujące:

  • Porządkowanie danych z każdej zmiennej w tabelach rozkładu częstotliwości.
  • wyświetlanie danych ze zmiennej kluczowej na wykresie słupkowym, aby zobaczyć rozkład odpowiedzi.
  • Wizualizacja relacji między dwiema zmiennymi za pomocą wykresu punktowego.

wizualizując dane w tabelach i wykresach, możesz ocenić, czy Twoje dane mają rozkład wypaczony lub normalny oraz czy występują jakieś wartości odstające lub brakujące dane.

rozkład normalny oznacza, że Twoje dane są symetrycznie rozmieszczone wokół centrum, w którym leży większość wartości, z wartościami zwężającymi się na końcach.

średnia, mediana, tryb i odchylenie standardowe w rozkładzie normalnym

średnia, mediana, tryb i odchylenie standardowe w rozkładzie normalnym

natomiast przekrzywiony rozkład jest asymetryczny i ma więcej wartości na jednym końcu niż na drugim. Kształt rozkładu jest ważne, aby pamiętać, ponieważ tylko niektóre statystyki opisowe powinny być używane z wypaczonych rozkładów.

skrajne wartości odstające mogą również powodować mylące statystyki, więc możesz potrzebować systematycznego podejścia do radzenia sobie z tymi wartościami.

Oblicz Miary tendencji centralnej

Miary tendencji centralnej opisują, gdzie leży większość wartości w zbiorze danych. Często podaje się trzy główne Miary tendencji centralnej:

  • tryb: najpopularniejsza odpowiedź lub wartość w zbiorze danych.
  • Mediana: wartość w dokładnym środku zestawu danych przy zamówieniu od niskiego do wysokiego.
  • średnia: suma wszystkich wartości podzielona przez liczbę wartości.

jednak w zależności od kształtu rozkładu i poziomu pomiaru, tylko jeden lub dwa z tych środków mogą być odpowiednie. Na przykład wiele cech demograficznych można opisać tylko za pomocą trybu lub proporcji, podczas gdy zmienna taka jak czas reakcji może w ogóle nie mieć trybu.

Oblicz miary zmienności

miary zmienności mówią, jak rozłożone są wartości w zbiorze danych. Cztery główne miary zmienności są często zgłaszane:

  • zakres: najwyższa wartość minus najniższa wartość zestawu danych.
  • zakres Międzykwartylowy: zakres Środkowej połowy zbioru danych.
  • odchylenie standardowe: średnia odległość między każdą wartością w zbiorze danych a średnią.
  • wariancja: kwadrat odchylenia standardowego.

po raz kolejny kształt rozkładu i poziom pomiaru powinny kierować wyborem statystyk zmienności. Zakres międzykwartylowy jest najlepszą miarą dla wypaczonych rozkładów, podczas gdy odchylenie standardowe i wariancja dostarczają najlepszych informacji dla rozkładów normalnych.

  • eksperymentalne
  • korelacyjne
przykład: Statystyka opisowa (eksperyment)
po zebraniu danych wstępnych i posttestowych od 30 uczniów z całego miasta, obliczasz statystyki opisowe. Ponieważ masz normalne dane rozproszone w skali interwałowej, zestawiasz średnią, odchylenie standardowe, wariancję i zakres.

korzystając z tabeli, należy sprawdzić, czy jednostki statystyki opisowej są porównywalne dla wyników testów wstępnych i posttestowych. Na przykład, czy poziomy wariancji są podobne w poszczególnych grupach? Czy są jakieś ekstremalne wartości? Jeśli tak, może być konieczne zidentyfikowanie i usunięcie skrajnych wartości odstających w zbiorze danych lub przekształcenie danych przed wykonaniem testu statystycznego.

wyniki testów wstępnych wyniki testów wstępnych
Średnia 68.44 75.25
odchylenie standardowe 9.43 9.88
wariancja 88.96 97.96
zakres 36.25 45.12
N 30

z tej tabeli możemy zobaczyć, że średni wynik wzrósł po ćwiczeniu medytacji, a różnice obu wyników są porównywalne. Następnie możemy wykonać test statystyczny, aby dowiedzieć się, czy ta poprawa wyników testu jest statystycznie istotna w populacji.

przykład: Statystyka opisowa (badanie korelacyjne)
po zebraniu danych od 653 uczniów, zestawiasz statystyki opisowe dla rocznego dochodu rodziców i średniej średniej.

ważne jest, aby sprawdzić, czy masz szeroki zakres punktów danych. Jeśli tego nie zrobisz, Twoje dane mogą być bardziej wypaczone w stosunku do niektórych grup niż innych (np. osoby osiągające wysokie wyniki w nauce), a tylko ograniczone wnioski mogą być wyciągane na temat związku.

dochód rodziców (USD) GPA
Średnia 62,100 3.12
odchylenie standardowe 15,000 0.45
wariancja 225,000,000 0.16
zakres 8,000–378,000 2.64–4.00
N 653

następnie możemy obliczyć współczynnik korelacji i wykonać test statystyczny, aby zrozumieć znaczenie relacji między zmiennymi w populacji.

Krok 4: Testuj hipotezy lub dokonuj szacunków za pomocą statystyki wnioskowej

liczba opisująca próbkę nazywa się statystyką, podczas gdy liczba opisująca populację nazywa się parametrem. Korzystając ze statystyk wnioskowania, możesz wyciągać wnioski na temat parametrów populacji na podstawie statystyk próbek.

badacze często używają dwóch głównych metod (jednocześnie) do wnioskowania w statystyce.

  • Szacowanie: obliczanie parametrów populacji na podstawie statystyk próbki.
  • testowanie hipotez: formalny proces testowania prognoz badawczych dotyczących populacji przy użyciu próbek.

Szacowanie

możesz dokonać dwóch rodzajów szacowania parametrów populacji z przykładowych statystyk:

  • estymacja punktowa: wartość, która reprezentuje najlepsze odgadnięcie dokładnego parametru.
  • oszacowanie interwału: zakres wartości, które reprezentują najlepsze odgadnięcie, gdzie leży parametr.

jeśli twoim celem jest wnioskowanie i raportowanie charakterystyk populacji na podstawie przykładowych danych, najlepiej jest użyć zarówno oszacowań punktowych, jak i interwałowych w swoim artykule.

możesz rozważyć statystykę próbki szacunkowy punkt dla parametru populacji, gdy masz reprezentatywną próbkę (np. w szerokim sondażu opinii publicznej, odsetek próbki, która obsługuje obecny rząd jest traktowana jako odsetek populacji zwolenników rządu).

w estymacji zawsze występuje błąd, więc powinieneś również podać przedział ufności jako estymację interwału, aby pokazać zmienność wokół estymacji punktowej.

przedział ufności wykorzystuje błąd standardowy i wynik z ze standardowego rozkładu normalnego, aby przekazać, gdzie zazwyczaj można oczekiwać znalezienia parametru populacji przez większość czasu.

Testowanie hipotez

korzystając z danych z próbki, możesz przetestować hipotezy dotyczące relacji między zmiennymi w populacji. Testowanie hipotezy zaczyna się od założenia, że hipoteza zerowa jest prawdziwa w populacji, i użyć testów statystycznych do oceny, czy hipoteza zerowa może być odrzucona, czy nie.

testy statystyczne określić, gdzie dane próbki będzie leżeć na oczekiwanym rozkładzie danych Próbki, jeśli hipoteza zerowa była prawdziwa. Testy te dają dwa główne wyniki:

  • statystyka testu mówi, jak bardzo Twoje dane różnią się od hipotezy zerowej testu.
  • wartość p mówi prawdopodobieństwo uzyskania wyników, jeśli hipoteza zerowa jest rzeczywiście prawdziwe w populacji.

testy statystyczne występują w trzech głównych odmianach:

  • testy porównawcze oceniają różnice grupowe w wynikach.
  • testy regresji oceniają związki przyczynowo-skutkowe między zmiennymi.
  • testy korelacji oceniają relacje między zmiennymi bez zakładania przyczynowości.

wybór testu statystycznego zależy od pytań badawczych, projektu badawczego, metody pobierania próbek i charakterystyki danych.

testy parametryczne

testy parametryczne pozwalają wnioskować o populacji na podstawie danych z próbek. Aby jednak z nich korzystać, muszą być spełnione pewne założenia i można stosować tylko niektóre typy zmiennych. Jeśli Twoje dane naruszają te założenia, możesz wykonać odpowiednie przekształcenia danych lub zamiast tego użyć alternatywnych testów nieparametrycznych.

regresja modeluje zakres, w jakim zmiany w zmiennej predyktora skutkują zmianami w zmiennej (- ach) wyników.

  • prosta regresja liniowa zawiera jedną zmienną predyktorową i jedną zmienną wynikową.
  • wielokrotna regresja liniowa obejmuje dwie lub więcej zmiennych predyktorskich i jedną zmienną wynikową.

testy porównawcze Zwykle porównują średnie grupy. Mogą to być środki różnych grup w próbce (np. Grupa leczona i kontrolna), środki jednej grupy próbnej pobrane w różnym czasie (np. wyniki testu wstępnego i posttestu) lub średnia próby i średnia populacji.

  • test t jest dla dokładnie 1 lub 2 grup, gdy próbka jest mała (30 lub mniej).
  • test z dotyczy dokładnie 1 lub 2 grup, gdy próbka jest duża.
  • ANOVA jest dla 3 lub więcej grup.

testy z i t mają podtypy oparte na liczbie i rodzajach próbek oraz hipotezach:

  • jeśli masz tylko jedną próbkę, którą chcesz porównać ze średnią populacyjną, użyj testu z jedną próbką.
  • jeśli masz sparowane pomiary (projekt wewnątrz obiektów), użyj zależnego (sparowanego) testu próbek.
  • jeśli masz całkowicie oddzielne pomiary z dwóch niezrównanych grup (projekt między obiektami), użyj niezależnego testu próbek.
  • jeśli spodziewasz się różnicy między grupami w określonym kierunku, użyj testu jednoogonowego.
  • jeśli nie masz żadnych oczekiwań co do kierunku różnicy między grupami, użyj testu dwuogonowego.

jedynym parametrycznym testem korelacji jest R Pearsona. współczynnik korelacji (r) mówi o sile liniowej zależności między dwiema zmiennymi ilościowymi.

jednak, aby sprawdzić, czy korelacja w próbce jest wystarczająco silna, aby była ważna w populacji, musisz również wykonać test istotności współczynnika korelacji, Zwykle test t, aby uzyskać wartość P. Ten test wykorzystuje wielkość próby do obliczenia, jak bardzo współczynnik korelacji różni się od zera w populacji.

  • eksperymentalne
  • korelacyjne
przykład: sparowany test t do badań eksperymentalnych
ponieważ twój projekt badawczy jest eksperymentem wewnątrz obiektów, zarówno pomiary przedtestowe, jak i posttestowe pochodzą z tej samej grupy,więc potrzebujesz zależnego (sparowanego ) testu T. Ponieważ przewidujesz zmianę w określonym kierunku (poprawę wyników testu), potrzebujesz testu z jednym ogonem.

korzystasz z testu zależnego, jednoogonowego t, aby ocenić, czy ćwiczenie medytacyjne znacząco poprawiło wyniki testów matematycznych. Test daje:

  • a wartość t (statystyka badania) 3.00
  • a wartość p 0.0028
przykład: współczynnik korelacji i test istotności
używasz r Pearsona do obliczenia siły liniowej zależności między dochodem rodziców a GPA w Twojej próbie. Wartość R Pearsona wynosi 0,12, co wskazuje na niewielką korelację w próbce.

chociaż R Pearsona jest statystyką testową, nie mówi nic o tym, jak istotna jest korelacja w populacji. Musisz również sprawdzić, czy ten współczynnik korelacji próbki jest wystarczająco duży, aby wykazać korelację w populacji.

test t może również określić, jak znacząco współczynnik korelacji różni się od zera w zależności od wielkości próbki. Ponieważ spodziewasz się pozytywnej korelacji między dochodem rodziców a średnią, używasz testu t z jedną próbką. Test t daje:

  • a wartość t 3,08
  • a wartość p 0.001

Krok 5: Interpretacja wyników

ostatnim etapem analizy statystycznej jest interpretacja wyników.

istotność statystyczna

w testowaniu hipotez istotność statystyczna jest głównym kryterium formułowania wniosków. Porównujesz swoją wartość p z ustalonym poziomem istotności (Zwykle 0,05), aby zdecydować, czy Twoje wyniki są istotne statystycznie, czy nieistotne.

statystycznie istotne wyniki uważa się za mało prawdopodobne, aby powstały wyłącznie z powodu przypadku. Istnieje tylko bardzo mała szansa na taki wynik, jeśli hipoteza zerowa jest prawdziwa w populacji.

  • eksperymentalne
  • korelacyjne
przykład: zinterpretuj wyniki (eksperyment)
porównujesz wartość p z 0,0027 do progu istotności 0,05. Ponieważ twoja wartość p jest niższa, decydujesz się odrzucić hipotezę zerową, a Twoje wyniki są statystycznie istotne.

oznacza to, że wierzysz, że interwencja medytacyjna, a nie przypadkowe czynniki, bezpośrednio spowodowała wzrost wyników testu.

przykład: zinterpretuj wyniki (badanie korelacyjne)
porównujesz wartość p z 0,001 do progu istotności 0,05. Z wartością p poniżej tego progu, można odrzucić hipotezę zerową. Wskazuje to na statystycznie istotną korelację między dochodem rodziców a średnią ocen u mężczyzn.

zauważ, że korelacja nie zawsze oznacza związek przyczynowy, ponieważ często istnieje wiele podstawowych czynników przyczyniających się do złożonej zmiennej, takiej jak GPA. Nawet jeśli jedna zmienna jest powiązana z inną, może to być spowodowane trzecią zmienną wpływającą na obie z nich lub pośrednimi powiązaniami między dwiema zmiennymi.

duża wielkość próby może również silnie wpływać na istotność statystyczną współczynnika korelacji, dzięki czemu bardzo małe współczynniki korelacji wydają się znaczące.

wielkość efektu

statystycznie istotny wynik nie musi oznaczać, że istnieją ważne rzeczywiste zastosowania lub wyniki kliniczne dla stwierdzenia.

natomiast wielkość efektu wskazuje na praktyczne znaczenie twoich wyników. Ważne jest, aby zgłaszać rozmiary efektów wraz z wnioskowymi statystykami, aby uzyskać pełny obraz wyników. Jeśli piszesz artykuł w stylu APA, powinieneś również zgłosić szacunki interwałów rozmiarów efektów.

  • eksperymentalne
  • korelacyjne
przykład: wielkość efektu (eksperyment)
obliczasz wartość d Cohena, aby znaleźć wielkość różnicy między wynikami przed i po testach.

z d równym 0.72, ma średnie do wysokiego praktyczne znaczenie dla stwierdzenia, że ćwiczenie medytacji poprawiło wyniki testów.

przykład: wielkość efektu (badanie korelacyjne)
aby określić wielkość efektu współczynnika korelacji, porównujesz wartość R Pearsona z kryteriami wielkości efektu Cohena.

ponieważ twoja wartość wynosi od 0,1 do 0,3, Twoje ustalenie związku między dochodem rodziców a GPA stanowi bardzo mały efekt i ma ograniczone praktyczne znaczenie.

błędy decyzyjne

błędy typu I i typu II to błędy popełnione we wnioskach z badań. Typ i błąd oznacza odrzucenie hipotezy zerowej, gdy jest to rzeczywiście prawda, podczas gdy typ II błąd oznacza odrzucenie hipotezy zerowej, gdy jest to fałszywe.

możesz dążyć do zminimalizowania ryzyka wystąpienia tych błędów, wybierając optymalny poziom istotności i zapewniając wysoką moc. Istnieje jednak kompromis między tymi dwoma błędami, więc konieczna jest dobra równowaga.

Frequentist kontra bayesowskie statystyki

tradycyjnie, frequentist statystyki podkreśla testowanie znaczenia hipotezy zerowej i zawsze zaczyna się od założenia prawdziwej hipotezy zerowej.

jednak statystyki bayesowskie zyskały na popularności jako alternatywne podejście w ciągu ostatnich kilku dekad. W tym podejściu korzystasz z wcześniejszych badań, aby stale aktualizować swoje hipotezy w oparciu o Twoje oczekiwania i obserwacje.

Współczynnik Bayesa porównuje względną siłę dowodów na zerową w porównaniu z hipotezą alternatywną, zamiast wyciągać wnioski o odrzuceniu hipotezy zerowej, czy nie.

Najczęściej zadawane pytania dotyczące analizy statystycznej

co to jest analiza statystyczna?

analiza statystyczna jest główną metodą analizy ilościowych danych badawczych. Wykorzystuje prawdopodobieństwa i modele do testowania prognoz dotyczących populacji na podstawie danych z próbek.

Jaka jest różnica między statystyką opisową a wnioskową?

statystyki opisowe podsumowują charakterystykę zbioru danych. Statystyki wnioskowania pozwalają przetestować hipotezę lub ocenić, czy dane są uogólniane dla szerszej populacji.

czym jest testowanie hipotez?

testowanie hipotez jest formalną procedurą badania naszych wyobrażeń o świecie za pomocą statystyk. Jest on używany przez naukowców do testowania konkretnych przewidywań, zwanych hipotezami, poprzez obliczanie prawdopodobieństwa, że wzór lub zależność między zmiennymi mogły powstać przez przypadek.

czym są hipotezy zerowe i alternatywne?

w testowaniu hipotezy statystycznej, hipoteza zerowa testu zawsze przewiduje brak efektu lub brak relacji między zmiennymi, podczas gdy hipoteza alternatywna stwierdza swoje przewidywania badań efektu lub związku.

co to jest istotność statystyczna?

istotność statystyczna jest terminem używanym przez naukowców do stwierdzenia, że jest mało prawdopodobne, aby ich obserwacje mogły wystąpić pod hipotezą zerową testu statystycznego. Znaczenie jest zwykle oznaczane przez wartość p lub wartość prawdopodobieństwa.

istotność statystyczna jest dowolna-zależy od wybranego przez badacza progu, czyli wartości alfa. Najczęstszym progiem jest P < 0,05, co oznacza, że dane mogą wystąpić mniej niż 5% czasu pod hipotezą zerową.

gdy wartość p spadnie poniżej wybranej wartości alfa, mówimy, że wynik testu jest statystycznie istotny.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.