analiza statystyczna oznacza badanie trendów, wzorców i Relacji z wykorzystaniem danych ilościowych. Jest ważnym narzędziem badawczym używanym przez naukowców, rządy, firmy i inne organizacje.
aby wyciągnąć prawidłowe wnioski, analiza statystyczna wymaga starannego planowania od samego początku procesu badawczego. Musisz określić swoje hipotezy i podjąć decyzje dotyczące projektu badawczego, wielkości próbki i procedury pobierania próbek.
po zebraniu danych z próbki można organizować i podsumowywać dane za pomocą statystyk opisowych. Następnie możesz użyć wnioskujących statystyk, aby formalnie przetestować hipotezy i dokonać szacunków dotyczących populacji. Wreszcie, można interpretować i uogólniać swoje wnioski.
ten artykuł jest praktycznym wprowadzeniem do analizy statystycznej dla studentów i naukowców. Przeprowadzimy Cię przez kroki, korzystając z dwóch przykładów badawczych. Pierwszy bada potencjalną zależność przyczynowo-skutkową, podczas gdy drugi bada potencjalną korelację między zmiennymi.
Krok 1: Napisz swoje hipotezy i zaplanuj swój projekt badawczy
aby zebrać poprawne dane do analizy statystycznej, musisz najpierw określić swoje hipotezy i zaplanować swój projekt badawczy.
pisanie hipotez statystycznych
celem badań jest często zbadanie zależności między zmiennymi w populacji. Zaczynasz od prognozy i korzystasz z analizy statystycznej, aby ją przetestować.
hipoteza statystyczna jest formalnym sposobem pisania prognozy o populacji. Każda prognoza badawcza jest przekształcana w hipotezy zerowe i alternatywne, które można przetestować za pomocą przykładowych danych.
podczas gdy hipoteza zerowa zawsze przewiduje brak efektu lub brak relacji między zmiennymi, hipoteza alternatywna stwierdza swoje przewidywania badań efektu lub związku.
Planowanie projektu badawczego
projekt badawczy to ogólna strategia gromadzenia i analizy danych. Określa testy statystyczne, których możesz później użyć do przetestowania swojej hipotezy.
najpierw zdecyduj, czy twoje badania będą korzystać z projektu opisowego, korelacyjnego lub eksperymentalnego. Eksperymenty bezpośrednio wpływają na zmienne, podczas gdy badania opisowe i korelacyjne mierzą tylko zmienne.
- w projekcie eksperymentalnym można ocenić związek przyczynowo-skutkowy (np. wpływ medytacji na wyniki testu) za pomocą statystycznych testów porównawczych lub regresji.
- w projekcie korelacyjnym można badać relacje między zmiennymi (np., dochód rodziców i GPA) bez żadnego założenia przyczynowości przy użyciu współczynników korelacji i testów istotności.
- w projekcie opisowym można badać cechy populacji lub zjawiska (np. częstość występowania lęku u amerykańskich studentów) za pomocą testów statystycznych w celu wyciągnięcia wniosków z przykładowych danych.
Twój projekt badawczy dotyczy również tego, czy porównasz uczestników na poziomie grupowym, indywidualnym, czy obu.
- w projekcie między podmiotami porównujesz wyniki na poziomie grupowym uczestników, którzy byli narażeni na różne zabiegi (np. ci, którzy wykonywali ćwiczenia medytacyjne, vs ci, którzy nie wykonywali).
- w projekcie wewnątrz przedmiotów porównujesz powtarzane miary uczestników, którzy uczestniczyli we wszystkich zabiegach w badaniu (np. wyniki przed i po wykonaniu ćwiczenia medytacyjnego).
- Eksperymentalne
- Korelacyjne
pomiar zmiennych
planując projekt badawczy, należy operować zmienne i zdecydować, jak dokładnie je zmierzyć.
do analizy statystycznej ważne jest, aby wziąć pod uwagę poziom pomiaru zmiennych, który mówi, jakiego rodzaju dane zawierają:
- dane kategoryczne reprezentują grupy. Mogą być nominalne (np., płeć) lub porządkowy (np. poziom umiejętności językowych).
- dane ilościowe przedstawiają kwoty. Mogą to być skala interwałowa (np. wynik testu) lub skala proporcji (np. wiek).
wiele zmiennych można zmierzyć z różnymi poziomami precyzji. Na przykład dane dotyczące wieku mogą być ilościowe (8 lat) lub kategoryczne (Młody). Jeśli zmienna jest kodowana numerycznie (np. poziom umowy od 1-5), nie oznacza to automatycznie, że jest ilościowa, a nie kategoryczna.
określenie poziomu pomiaru jest ważne dla wyboru odpowiednich statystyk i testów hipotez. Na przykład można obliczyć średni wynik za pomocą danych ilościowych, ale nie za pomocą danych kategorycznych.
w badaniu badawczym, wraz z pomiarami interesujących Cię zmiennych, często zbierasz dane dotyczące odpowiednich cech uczestników.
- Eksperymentalne
- Korelacyjne
zmienna | typ danych |
---|---|
wiek | Ilość (stosunek) |
płeć | kategoryczna (nominalna) |
rasa lub pochodzenie etniczne | kategoryczne (nominalne) |
wyjściowe wyniki badań | ilościowe (interwał) |
końcowe wyniki testu | ilościowe (interwał) |
zmienna | typ danych |
---|---|
dochody rodziców | ilościowe (stosunek) |
GPA | ilościowe (interwał) |
Krok 2: Zbierz dane z próby
w większości przypadków zbieranie danych od każdego członka populacji, którego interesuje badanie, jest zbyt trudne lub kosztowne. Zamiast tego będziesz zbierać dane z próbki.
Analiza statystyczna pozwala na zastosowanie wyników poza własną próbką, o ile stosuje się odpowiednie procedury pobierania próbek. Należy dążyć do próbki, która jest reprezentatywna dla populacji.
pobieranie próbek do analizy statystycznej
istnieją dwa główne podejścia do wyboru próby.
- próbkowanie prawdopodobieństwa: każdy członek populacji ma szansę być wybrany do badania poprzez wybór losowy.
- próbkowanie bez prawdopodobieństwa: niektórzy członkowie populacji są bardziej prawdopodobne niż inni, aby zostać wybranym do badania ze względu na kryteria, takie jak wygoda lub dobrowolny self-selection.
w teorii, w przypadku wysoce uogólnionych ustaleń, należy użyć metody próbkowania prawdopodobieństwa. Losowy wybór zmniejsza odchylenie próbkowania i zapewnia, że dane z próbki jest rzeczywiście typowe dla populacji. Testy parametryczne mogą być wykorzystywane do silnych wniosków statystycznych, gdy dane są zbierane za pomocą próbkowania prawdopodobieństwa.
ale w praktyce rzadko jest możliwe zebranie idealnej próbki. Chociaż próbki bez prawdopodobieństwa są bardziej podatne na stronniczość, są one znacznie łatwiejsze do rekrutacji i zbierania danych. Testy nieparametryczne są bardziej odpowiednie dla próbek innych niż prawdopodobieństwo, ale skutkują słabszymi wnioskami na temat populacji.
jeśli chcesz użyć testów parametrycznych dla próbek innych niż prawdopodobieństwo, musisz stwierdzić, że:
- twoja próbka jest reprezentatywna dla populacji, do której uogólniasz swoje wyniki.
- twoja próba nie jest systematyczna.
pamiętaj, że zewnętrzna Ważność oznacza, że możesz uogólniać swoje wnioski tylko dla innych, którzy podzielają cechy twojej próbki. Na przykład, wynika z zachodnich, wykształconych, uprzemysłowionych, bogatych i demokratycznych próbek (np., studentów w USA) nie są automatycznie stosowane do wszystkich nie-dziwnych populacji.
jeśli zastosujesz testy parametryczne do danych z próbek innych niż prawdopodobieństwo, pamiętaj, aby rozwinąć ograniczenia dotyczące tego, w jakim stopniu wyniki mogą być uogólnione w sekcji dyskusji.
stwórz odpowiednią procedurę pobierania próbek
na podstawie dostępnych zasobów do badań, zdecyduj, w jaki sposób zrekrutujesz uczestników.
- czy będziesz miał środki, aby reklamować swoje studia szeroko, w tym poza uczelnią?
- czy będziesz miał środki, aby zrekrutować zróżnicowaną próbkę, która reprezentuje szeroką populację?
- czy masz czas na kontakt z członkami trudno dostępnych grup?
- eksperymentalne
- korelacyjne
Oblicz wystarczającą wielkość próby
przed rekrutacją uczestników zdecyduj o wielkości próby, patrząc na inne badania w swojej dziedzinie lub korzystając ze statystyk. Zbyt mała próbka może być niereprezentatywna próbki, podczas gdy zbyt duża próbka będzie bardziej kosztowna niż to konieczne.
istnieje wiele kalkulatorów wielkości próbek online. Różne formuły są używane w zależności od tego, czy masz podgrupy lub jak rygorystyczne badanie powinno być (np. w badaniach klinicznych). Z reguły konieczne jest minimum 30 jednostek lub więcej na podgrupę.
aby korzystać z tych kalkulatorów, musisz zrozumieć i wprowadzić te kluczowe komponenty:
- poziom istotności (alpha): ryzyko odrzucenia prawdziwej hipotezy zerowej, że jesteś gotów podjąć, zwykle ustawiony na 5%.
- Siła statystyczna: prawdopodobieństwo twojego badania wykrycia efektu o określonej wielkości, jeśli taki istnieje, Zwykle 80% lub więcej.
- oczekiwany rozmiar efektu: standaryzowane wskazanie, jak duży będzie oczekiwany wynik badania, zwykle w oparciu o inne podobne badania.
- odchylenie standardowe populacji: oszacowanie parametru populacji na podstawie wcześniejszego badania lub własnego badania pilotażowego.
Krok 3: Podsumuj dane za pomocą statystyk opisowych
po zebraniu wszystkich danych możesz je sprawdzić i obliczyć statystyki opisowe, które je podsumowują.
Sprawdź swoje dane
istnieją różne sposoby sprawdzania danych, w tym następujące:
- Porządkowanie danych z każdej zmiennej w tabelach rozkładu częstotliwości.
- wyświetlanie danych ze zmiennej kluczowej na wykresie słupkowym, aby zobaczyć rozkład odpowiedzi.
- Wizualizacja relacji między dwiema zmiennymi za pomocą wykresu punktowego.
wizualizując dane w tabelach i wykresach, możesz ocenić, czy Twoje dane mają rozkład wypaczony lub normalny oraz czy występują jakieś wartości odstające lub brakujące dane.
rozkład normalny oznacza, że Twoje dane są symetrycznie rozmieszczone wokół centrum, w którym leży większość wartości, z wartościami zwężającymi się na końcach.
natomiast przekrzywiony rozkład jest asymetryczny i ma więcej wartości na jednym końcu niż na drugim. Kształt rozkładu jest ważne, aby pamiętać, ponieważ tylko niektóre statystyki opisowe powinny być używane z wypaczonych rozkładów.
skrajne wartości odstające mogą również powodować mylące statystyki, więc możesz potrzebować systematycznego podejścia do radzenia sobie z tymi wartościami.
Oblicz Miary tendencji centralnej
Miary tendencji centralnej opisują, gdzie leży większość wartości w zbiorze danych. Często podaje się trzy główne Miary tendencji centralnej:
- tryb: najpopularniejsza odpowiedź lub wartość w zbiorze danych.
- Mediana: wartość w dokładnym środku zestawu danych przy zamówieniu od niskiego do wysokiego.
- średnia: suma wszystkich wartości podzielona przez liczbę wartości.
jednak w zależności od kształtu rozkładu i poziomu pomiaru, tylko jeden lub dwa z tych środków mogą być odpowiednie. Na przykład wiele cech demograficznych można opisać tylko za pomocą trybu lub proporcji, podczas gdy zmienna taka jak czas reakcji może w ogóle nie mieć trybu.
Oblicz miary zmienności
miary zmienności mówią, jak rozłożone są wartości w zbiorze danych. Cztery główne miary zmienności są często zgłaszane:
- zakres: najwyższa wartość minus najniższa wartość zestawu danych.
- zakres Międzykwartylowy: zakres Środkowej połowy zbioru danych.
- odchylenie standardowe: średnia odległość między każdą wartością w zbiorze danych a średnią.
- wariancja: kwadrat odchylenia standardowego.
po raz kolejny kształt rozkładu i poziom pomiaru powinny kierować wyborem statystyk zmienności. Zakres międzykwartylowy jest najlepszą miarą dla wypaczonych rozkładów, podczas gdy odchylenie standardowe i wariancja dostarczają najlepszych informacji dla rozkładów normalnych.
- eksperymentalne
- korelacyjne
korzystając z tabeli, należy sprawdzić, czy jednostki statystyki opisowej są porównywalne dla wyników testów wstępnych i posttestowych. Na przykład, czy poziomy wariancji są podobne w poszczególnych grupach? Czy są jakieś ekstremalne wartości? Jeśli tak, może być konieczne zidentyfikowanie i usunięcie skrajnych wartości odstających w zbiorze danych lub przekształcenie danych przed wykonaniem testu statystycznego.
wyniki testów wstępnych | wyniki testów wstępnych | |
---|---|---|
Średnia | 68.44 | 75.25 |
odchylenie standardowe | 9.43 | 9.88 |
wariancja | 88.96 | 97.96 |
zakres | 36.25 | 45.12 |
N | 30 |
z tej tabeli możemy zobaczyć, że średni wynik wzrósł po ćwiczeniu medytacji, a różnice obu wyników są porównywalne. Następnie możemy wykonać test statystyczny, aby dowiedzieć się, czy ta poprawa wyników testu jest statystycznie istotna w populacji.
ważne jest, aby sprawdzić, czy masz szeroki zakres punktów danych. Jeśli tego nie zrobisz, Twoje dane mogą być bardziej wypaczone w stosunku do niektórych grup niż innych (np. osoby osiągające wysokie wyniki w nauce), a tylko ograniczone wnioski mogą być wyciągane na temat związku.
dochód rodziców (USD) | GPA | |
---|---|---|
Średnia | 62,100 | 3.12 |
odchylenie standardowe | 15,000 | 0.45 |
wariancja | 225,000,000 | 0.16 |
zakres | 8,000–378,000 | 2.64–4.00 |
N | 653 |
następnie możemy obliczyć współczynnik korelacji i wykonać test statystyczny, aby zrozumieć znaczenie relacji między zmiennymi w populacji.
Krok 4: Testuj hipotezy lub dokonuj szacunków za pomocą statystyki wnioskowej
liczba opisująca próbkę nazywa się statystyką, podczas gdy liczba opisująca populację nazywa się parametrem. Korzystając ze statystyk wnioskowania, możesz wyciągać wnioski na temat parametrów populacji na podstawie statystyk próbek.
badacze często używają dwóch głównych metod (jednocześnie) do wnioskowania w statystyce.
- Szacowanie: obliczanie parametrów populacji na podstawie statystyk próbki.
- testowanie hipotez: formalny proces testowania prognoz badawczych dotyczących populacji przy użyciu próbek.
Szacowanie
możesz dokonać dwóch rodzajów szacowania parametrów populacji z przykładowych statystyk:
- estymacja punktowa: wartość, która reprezentuje najlepsze odgadnięcie dokładnego parametru.
- oszacowanie interwału: zakres wartości, które reprezentują najlepsze odgadnięcie, gdzie leży parametr.
jeśli twoim celem jest wnioskowanie i raportowanie charakterystyk populacji na podstawie przykładowych danych, najlepiej jest użyć zarówno oszacowań punktowych, jak i interwałowych w swoim artykule.
możesz rozważyć statystykę próbki szacunkowy punkt dla parametru populacji, gdy masz reprezentatywną próbkę (np. w szerokim sondażu opinii publicznej, odsetek próbki, która obsługuje obecny rząd jest traktowana jako odsetek populacji zwolenników rządu).
w estymacji zawsze występuje błąd, więc powinieneś również podać przedział ufności jako estymację interwału, aby pokazać zmienność wokół estymacji punktowej.
przedział ufności wykorzystuje błąd standardowy i wynik z ze standardowego rozkładu normalnego, aby przekazać, gdzie zazwyczaj można oczekiwać znalezienia parametru populacji przez większość czasu.
Testowanie hipotez
korzystając z danych z próbki, możesz przetestować hipotezy dotyczące relacji między zmiennymi w populacji. Testowanie hipotezy zaczyna się od założenia, że hipoteza zerowa jest prawdziwa w populacji, i użyć testów statystycznych do oceny, czy hipoteza zerowa może być odrzucona, czy nie.
testy statystyczne określić, gdzie dane próbki będzie leżeć na oczekiwanym rozkładzie danych Próbki, jeśli hipoteza zerowa była prawdziwa. Testy te dają dwa główne wyniki:
- statystyka testu mówi, jak bardzo Twoje dane różnią się od hipotezy zerowej testu.
- wartość p mówi prawdopodobieństwo uzyskania wyników, jeśli hipoteza zerowa jest rzeczywiście prawdziwe w populacji.
testy statystyczne występują w trzech głównych odmianach:
- testy porównawcze oceniają różnice grupowe w wynikach.
- testy regresji oceniają związki przyczynowo-skutkowe między zmiennymi.
- testy korelacji oceniają relacje między zmiennymi bez zakładania przyczynowości.
wybór testu statystycznego zależy od pytań badawczych, projektu badawczego, metody pobierania próbek i charakterystyki danych.
testy parametryczne
testy parametryczne pozwalają wnioskować o populacji na podstawie danych z próbek. Aby jednak z nich korzystać, muszą być spełnione pewne założenia i można stosować tylko niektóre typy zmiennych. Jeśli Twoje dane naruszają te założenia, możesz wykonać odpowiednie przekształcenia danych lub zamiast tego użyć alternatywnych testów nieparametrycznych.
regresja modeluje zakres, w jakim zmiany w zmiennej predyktora skutkują zmianami w zmiennej (- ach) wyników.
- prosta regresja liniowa zawiera jedną zmienną predyktorową i jedną zmienną wynikową.
- wielokrotna regresja liniowa obejmuje dwie lub więcej zmiennych predyktorskich i jedną zmienną wynikową.
testy porównawcze Zwykle porównują średnie grupy. Mogą to być środki różnych grup w próbce (np. Grupa leczona i kontrolna), środki jednej grupy próbnej pobrane w różnym czasie (np. wyniki testu wstępnego i posttestu) lub średnia próby i średnia populacji.
- test t jest dla dokładnie 1 lub 2 grup, gdy próbka jest mała (30 lub mniej).
- test z dotyczy dokładnie 1 lub 2 grup, gdy próbka jest duża.
- ANOVA jest dla 3 lub więcej grup.
testy z i t mają podtypy oparte na liczbie i rodzajach próbek oraz hipotezach:
- jeśli masz tylko jedną próbkę, którą chcesz porównać ze średnią populacyjną, użyj testu z jedną próbką.
- jeśli masz sparowane pomiary (projekt wewnątrz obiektów), użyj zależnego (sparowanego) testu próbek.
- jeśli masz całkowicie oddzielne pomiary z dwóch niezrównanych grup (projekt między obiektami), użyj niezależnego testu próbek.
- jeśli spodziewasz się różnicy między grupami w określonym kierunku, użyj testu jednoogonowego.
- jeśli nie masz żadnych oczekiwań co do kierunku różnicy między grupami, użyj testu dwuogonowego.
jedynym parametrycznym testem korelacji jest R Pearsona. współczynnik korelacji (r) mówi o sile liniowej zależności między dwiema zmiennymi ilościowymi.
jednak, aby sprawdzić, czy korelacja w próbce jest wystarczająco silna, aby była ważna w populacji, musisz również wykonać test istotności współczynnika korelacji, Zwykle test t, aby uzyskać wartość P. Ten test wykorzystuje wielkość próby do obliczenia, jak bardzo współczynnik korelacji różni się od zera w populacji.
- eksperymentalne
- korelacyjne
Krok 5: Interpretacja wyników
ostatnim etapem analizy statystycznej jest interpretacja wyników.
istotność statystyczna
w testowaniu hipotez istotność statystyczna jest głównym kryterium formułowania wniosków. Porównujesz swoją wartość p z ustalonym poziomem istotności (Zwykle 0,05), aby zdecydować, czy Twoje wyniki są istotne statystycznie, czy nieistotne.
statystycznie istotne wyniki uważa się za mało prawdopodobne, aby powstały wyłącznie z powodu przypadku. Istnieje tylko bardzo mała szansa na taki wynik, jeśli hipoteza zerowa jest prawdziwa w populacji.
- eksperymentalne
- korelacyjne
wielkość efektu
statystycznie istotny wynik nie musi oznaczać, że istnieją ważne rzeczywiste zastosowania lub wyniki kliniczne dla stwierdzenia.
natomiast wielkość efektu wskazuje na praktyczne znaczenie twoich wyników. Ważne jest, aby zgłaszać rozmiary efektów wraz z wnioskowymi statystykami, aby uzyskać pełny obraz wyników. Jeśli piszesz artykuł w stylu APA, powinieneś również zgłosić szacunki interwałów rozmiarów efektów.
- eksperymentalne
- korelacyjne
błędy decyzyjne
błędy typu I i typu II to błędy popełnione we wnioskach z badań. Typ i błąd oznacza odrzucenie hipotezy zerowej, gdy jest to rzeczywiście prawda, podczas gdy typ II błąd oznacza odrzucenie hipotezy zerowej, gdy jest to fałszywe.
możesz dążyć do zminimalizowania ryzyka wystąpienia tych błędów, wybierając optymalny poziom istotności i zapewniając wysoką moc. Istnieje jednak kompromis między tymi dwoma błędami, więc konieczna jest dobra równowaga.
Frequentist kontra bayesowskie statystyki
tradycyjnie, frequentist statystyki podkreśla testowanie znaczenia hipotezy zerowej i zawsze zaczyna się od założenia prawdziwej hipotezy zerowej.
jednak statystyki bayesowskie zyskały na popularności jako alternatywne podejście w ciągu ostatnich kilku dekad. W tym podejściu korzystasz z wcześniejszych badań, aby stale aktualizować swoje hipotezy w oparciu o Twoje oczekiwania i obserwacje.
Współczynnik Bayesa porównuje względną siłę dowodów na zerową w porównaniu z hipotezą alternatywną, zamiast wyciągać wnioski o odrzuceniu hipotezy zerowej, czy nie.
Najczęściej zadawane pytania dotyczące analizy statystycznej
analiza statystyczna jest główną metodą analizy ilościowych danych badawczych. Wykorzystuje prawdopodobieństwa i modele do testowania prognoz dotyczących populacji na podstawie danych z próbek.
statystyki opisowe podsumowują charakterystykę zbioru danych. Statystyki wnioskowania pozwalają przetestować hipotezę lub ocenić, czy dane są uogólniane dla szerszej populacji.
testowanie hipotez jest formalną procedurą badania naszych wyobrażeń o świecie za pomocą statystyk. Jest on używany przez naukowców do testowania konkretnych przewidywań, zwanych hipotezami, poprzez obliczanie prawdopodobieństwa, że wzór lub zależność między zmiennymi mogły powstać przez przypadek.
w testowaniu hipotezy statystycznej, hipoteza zerowa testu zawsze przewiduje brak efektu lub brak relacji między zmiennymi, podczas gdy hipoteza alternatywna stwierdza swoje przewidywania badań efektu lub związku.
istotność statystyczna jest terminem używanym przez naukowców do stwierdzenia, że jest mało prawdopodobne, aby ich obserwacje mogły wystąpić pod hipotezą zerową testu statystycznego. Znaczenie jest zwykle oznaczane przez wartość p lub wartość prawdopodobieństwa.
istotność statystyczna jest dowolna-zależy od wybranego przez badacza progu, czyli wartości alfa. Najczęstszym progiem jest P < 0,05, co oznacza, że dane mogą wystąpić mniej niż 5% czasu pod hipotezą zerową.
gdy wartość p spadnie poniżej wybranej wartości alfa, mówimy, że wynik testu jest statystycznie istotny.