statistische analyse betekent het onderzoeken van trends, patronen en relaties met behulp van kwantitatieve gegevens. Het is een belangrijk onderzoeksinstrument dat wordt gebruikt door wetenschappers, overheden, bedrijven en andere organisaties.
om geldige conclusies te kunnen trekken, vereist de statistische analyse een zorgvuldige planning vanaf het begin van het onderzoeksproces. U moet uw hypothesen specificeren en beslissingen nemen over uw onderzoeksontwerp, steekproefgrootte en bemonsteringsprocedure.
na het verzamelen van gegevens uit uw steekproef, kunt u de gegevens ordenen en samenvatten met behulp van beschrijvende statistieken. Vervolgens kunt u inferentiële statistieken gebruiken om hypothesen formeel te testen en schattingen te maken over de populatie. Tenslotte kunt u uw bevindingen interpreteren en veralgemenen.
dit artikel is een praktische inleiding tot de statistische analyse voor studenten en onderzoekers. We nemen je mee door de stappen aan de hand van twee onderzoeksvoorbeelden. De eerste onderzoekt een potentiële oorzaak-en-gevolg relatie, terwijl de tweede onderzoekt een potentiële correlatie tussen variabelen.
Stap 1: Schrijf uw hypothesen en plan uw onderzoeksopzet
om geldige gegevens voor statistische analyse te verzamelen, moet u eerst uw hypothesen specificeren en uw onderzoeksopzet plannen.
statistische hypothesen schrijven
het doel van het onderzoek is vaak om een relatie tussen variabelen binnen een populatie te onderzoeken. Je begint met een voorspelling, en gebruikt statistische analyse om die voorspelling te testen.Een statistische hypothese is een formele manier om een voorspelling over een populatie te schrijven. Elke voorspelling van het onderzoek wordt geherformuleerd in nul en alternatieve hypothesen die kunnen worden getest gebruikend steekproefgegevens.
terwijl de nulhypothese altijd geen effect of geen relatie tussen variabelen voorspelt, stelt de alternatieve hypothese uw onderzoek voorspelling van een effect of relatie.
Planning uw onderzoeksontwerp
een onderzoeksontwerp is uw algemene strategie voor het verzamelen en analyseren van gegevens. Het bepaalt de statistische tests die u kunt gebruiken om uw hypothese later te testen.
bepaal eerst of uw onderzoek een beschrijvend, correlatief of experimenteel ontwerp zal gebruiken. Experimenten hebben een directe invloed op variabelen, terwijl beschrijvende en correlatiestudies alleen variabelen meten.
- in een experimenteel ontwerp kunt u een oorzaak-en-effectrelatie (bijvoorbeeld het effect van meditatie op testscores) beoordelen met behulp van statistische vergelijkings-of regressie-tests.
- in een correlatieontwerp kunt u relaties tussen variabelen (bijv., ouderlijk inkomen en GPA) zonder enige aanname van causaliteit met behulp van correlatiecoëfficiënten en significantie tests.
- in een beschrijvend ontwerp kunt u de kenmerken van een populatie of fenomeen (bijvoorbeeld de prevalentie van angst bij Amerikaanse studenten) bestuderen met behulp van statistische tests om conclusies te trekken uit steekproefgegevens.
uw onderzoeksopzet heeft ook betrekking op de vraag of u deelnemers op groepsniveau, individueel niveau of beide zult vergelijken.
- in een ontwerp tussen proefpersonen vergelijkt u de resultaten op groepsniveau van deelnemers die zijn blootgesteld aan verschillende behandelingen (bijvoorbeeld degenen die een meditatie-oefening hebben uitgevoerd versus degenen die dat niet deden).
- in een binnen-proefpersonen ontwerp, vergelijk je herhaalde metingen van deelnemers die hebben deelgenomen aan alle behandelingen van een studie (bijvoorbeeld scores van voor en na het uitvoeren van een meditatie oefening).
- Experimenteel
- Correlatie
meetvariabelen
bij het plannen van een onderzoeksontwerp dient u uw variabelen te operationaliseren en precies te bepalen hoe u ze wilt meten.
voor statistische analyse is het belangrijk om rekening te houden met het meetniveau van uw variabelen, die u vertelt wat voor soort gegevens ze bevatten:
- categorische gegevens vertegenwoordigen groeperingen. Deze kunnen nominaal zijn (bijv., geslacht) of ordinaal (bv. taalvaardigheid).
- kwantitatieve gegevens zijn bedragen. Deze kunnen op een interval schaal (bijvoorbeeld test score) of een ratio schaal (bijvoorbeeld leeftijd).
veel variabelen kunnen met verschillende nauwkeurigheidsniveaus worden gemeten. Leeftijdgegevens kunnen bijvoorbeeld kwantitatief (8 jaar oud) of categorisch (jong) zijn. Als een variabele numeriek wordt gecodeerd (bijvoorbeeld niveau van overeenkomst van 1-5), betekent dit niet automatisch dat het kwantitatief is in plaats van categorisch.
het bepalen van het meetniveau is belangrijk voor het kiezen van geschikte statistieken en hypothesetests. U kunt bijvoorbeeld een gemiddelde score berekenen met kwantitatieve gegevens, maar niet met categorische gegevens.
in een onderzoek, samen met metingen van uw variabelen van belang, zult u vaak gegevens verzamelen over relevante karakteristieken van deelnemers.
- Experimenteel
- Correlatie
Variabele | Type gegevens |
---|---|
Leeftijd | Kwantitatief (ratio) |
Geslacht | Categorische (nominale) |
Ras of etniciteit | Categorische (nominale) |
Baseline test scores | Kwantitatief (interval) |
Laatste test scores | Kwantitatief (interval) |
variabele | soort gegevens |
---|---|
ouderlijk inkomen | kwantitatief (verhouding) |
GPA | kwantitatief (interval) |
Stap 2: Verzamel gegevens uit een steekproef
in de meeste gevallen is het te moeilijk of te duur om gegevens te verzamelen van elk lid van de populatie die u wilt bestuderen. In plaats daarvan verzamelt u gegevens uit een monster.
statistische analyse stelt u in staat om uw bevindingen buiten uw eigen steekproef toe te passen, zolang u de juiste bemonsteringsprocedures gebruikt. Je moet streven naar een steekproef die representatief is voor de bevolking.
steekproef voor statistische analyse
er zijn twee belangrijke benaderingen voor de selectie van een steekproef.Kanssteekproeven :elk lid van de populatie heeft een kans om door middel van willekeurige selectie voor het onderzoek te worden geselecteerd.
in theorie dient u voor zeer generaliseerbare bevindingen een waarschijnlijkheidsbemonsteringsmethode te gebruiken. Willekeurige selectie vermindert sampling bias en zorgt ervoor dat de gegevens van uw steekproef is eigenlijk typisch voor de populatie. Parametrische tests kunnen worden gebruikt om sterke statistische gevolgtrekkingen te maken wanneer gegevens worden verzameld met behulp van kanssteekproeven.
maar in de praktijk is het zelden mogelijk om het ideale monster te verzamelen. Terwijl niet-waarschijnlijkheid monsters zijn meer kans om te worden bevooroordeeld, ze zijn veel gemakkelijker te werven en gegevens te verzamelen uit. Niet-parametrische tests zijn geschikter voor niet-kanssteekproeven, maar ze resulteren in zwakkere gevolgtrekkingen over de populatie.
als u parametrische tests wilt gebruiken voor niet-waarschijnlijkheidsmonsters, moet u het geval maken dat:
- uw steekproef is representatief voor de populatie waar u uw bevindingen aan veralgemeniseert.
- uw steekproef heeft geen systematische vertekening.
houd er rekening mee dat externe validiteit betekent dat u uw conclusies alleen kunt veralgemenen naar anderen die de kenmerken van uw steekproef delen. Bijvoorbeeld, resultaten van westerse, opgeleide, geïndustrialiseerde, rijke en democratische monsters (bijv., studenten in de VS) zijn niet automatisch van toepassing op alle niet-vreemde populaties.
als u parametrische tests toepast op gegevens van niet-waarschijnlijkheidssteekproeven, moet u in uw discussiegedeelte nader ingaan op de beperkingen van hoe ver uw resultaten kunnen worden gegeneraliseerd.
Maak een geschikte steekproefprocedure
op basis van de beschikbare middelen voor uw onderzoek, beslis over hoe u deelnemers zult werven.
- beschikt u over middelen om op grote schaal reclame te maken voor uw studie, ook buiten uw universitaire omgeving?
- beschikt u over de middelen om een gevarieerde steekproef te werven die een brede populatie vertegenwoordigt?
- heeft u tijd om contact op te nemen met leden van moeilijk bereikbare groepen?
- experimenteel
- correlatie
Bereken voldoende steekproefgrootte
voordat u deelnemers werft, bepaal uw steekproefgrootte door andere studies in uw vakgebied te bekijken of gebruik te maken van statistieken. Een monster dat te klein is kan niet representatief zijn voor de steekproef, terwijl een monster dat te groot is duurder zal zijn dan nodig.
er zijn veel rekenmachines voor steekproefgrootte online. Verschillende formules worden gebruikt afhankelijk van of u subgroepen hebt of hoe streng uw studie moet zijn (bijvoorbeeld in klinisch onderzoek). Als vuistregel is een minimum van 30 eenheden of meer per subgroep nodig.
om deze rekenmachines te gebruiken, moet u deze belangrijke componenten begrijpen en invoeren:
- Significance level (alpha): het risico van het afwijzen van een echte nulhypothese die u bereid bent te nemen, meestal ingesteld op 5%.
- statistisch vermogen: de kans dat uw studie een effect van een bepaalde omvang detecteert als dat er is, meestal 80% of meer.
- verwachte effectgrootte: een gestandaardiseerde indicatie van hoe groot het verwachte resultaat van uw studie zal zijn, meestal gebaseerd op andere soortgelijke studies.
- populatie standaarddeviatie: een schatting van de populatie-parameter op basis van een eerder onderzoek of een eigen pilotstudie.
Stap 3: VAT uw gegevens samen met beschrijvende statistieken
nadat u al uw gegevens hebt verzameld, kunt u ze inspecteren en beschrijvende statistieken berekenen die ze samenvatten.
inspecteer uw gegevens
er zijn verschillende manieren om uw gegevens te inspecteren, waaronder de volgende::
- het organiseren van gegevens van elke variabele in frequentieverdelingstabellen.
- gegevens weergeven van een belangrijke variabele in een staafdiagram om de verdeling van de antwoorden te bekijken.
- visualiseren van de relatie tussen twee variabelen met behulp van een scatter plot.
door uw gegevens in tabellen en grafieken te visualiseren, kunt u beoordelen of uw gegevens een scheefgetrokken of normale verdeling volgen en of er uitschieters of ontbrekende gegevens zijn.
een normale verdeling betekent dat uw gegevens symmetrisch worden verdeeld rond een centrum waar de meeste waarden liggen, waarbij de waarden aan de staartuiteinden afbouwen.
daarentegen is een schuine verdeling asymmetrisch en heeft meer waarden aan de ene kant dan aan de andere. De vorm van de distributie is belangrijk om in gedachten te houden, omdat alleen enkele beschrijvende statistieken moeten worden gebruikt met scheve distributies.
Extreme uitschieters kunnen ook misleidende statistieken produceren, dus u heeft wellicht een systematische aanpak nodig om met deze waarden om te gaan.
bereken metingen van centrale tendens
metingen van centrale tendens beschrijven waar de meeste waarden in een gegevensverzameling liggen. Drie hoofdmaten van centrale tendens worden vaak gerapporteerd:
- modus: de meest populaire respons of waarde in de dataset.
- mediaan: de waarde in het exacte midden van de dataset bij bestelling van laag naar hoog.
- gemiddelde: de som van alle waarden gedeeld door het aantal waarden.
afhankelijk van de vorm van de verdeling en het meetniveau kunnen echter slechts één of twee van deze maatregelen geschikt zijn. Bijvoorbeeld, veel demografische kenmerken kunnen alleen worden beschreven met behulp van de modus of verhoudingen, terwijl een variabele zoals reactietijd helemaal geen modus kan hebben.
Calculate measures of variability
variability Measures of variability vertelt u hoe de waarden in een dataset verdeeld zijn. Vier belangrijke variabiliteitsmaten worden vaak gerapporteerd:
- bereik: de hoogste waarde min de laagste waarde van de gegevensverzameling.
- Interkwartielafstand: het bereik van de middelste helft van de gegevensverzameling.
- standaardafwijking: de gemiddelde afstand tussen elke waarde in uw gegevensverzameling en het gemiddelde.
- variantie: het kwadraat van de standaardafwijking.
nogmaals, de vorm van de verdeling en het meetniveau moeten uw keuze van variabiliteitsstatistieken bepalen. Het interkwartielbereik is de beste maat voor schuine distributies, terwijl standaarddeviatie en variantie de beste informatie bieden voor normale distributies.
- experimenteel
- correlatie
aan de hand van uw tabel moet u controleren of de eenheden van de beschrijvende statistieken vergelijkbaar zijn voor pretest-en posttest-scores. Bijvoorbeeld, zijn de variantie niveaus vergelijkbaar tussen de groepen? Zijn er extreme waarden? Als die er zijn, moet u mogelijk extreme uitschieters in uw gegevensverzameling identificeren en verwijderen of uw gegevens transformeren voordat u een statistische test uitvoert.
Pretest scores | Posttest scores | |
---|---|---|
gemiddelde | 68.44 | 75.25 |
standaarddeviatie | 9.43 | 9.88 |
Variantie | 88.96 | 97.96 |
Bereik | 36.25 | 45.12 |
N | 30 |
Uit deze tabel kunnen we zien dat de gemiddelde score steeg na de meditatie oefening, en de varianties van de twee scores vergelijkbaar zijn. Vervolgens kunnen we een statistische test uitvoeren om uit te vinden of deze verbetering in testscores statistisch significant is in de populatie.
het is belangrijk om te controleren of u een breed scala aan datapunten heeft. Als u dat niet doet, uw gegevens kunnen worden scheefgetrokken naar sommige groepen meer dan anderen (bijvoorbeeld hoge academische presteerders), en slechts beperkte gevolgtrekkingen kunnen worden gemaakt over een relatie.
ouderlijk inkomen (USD) | GPA | |
---|---|---|
gemiddelde | 62,100 | 3.12 |
Standaard afwijking | 15,000 | 0.45 |
Variantie | 225,000,000 | 0.16 |
Bereik | 8,000–378,000 | 2.64–4.00 |
N | 653 |
Vervolgens kunnen we berekenen een correlatie-coëfficiënt en het uitvoeren van een statistische toets om de betekenis te begrijpen van de relatie tussen de variabelen in de populatie.
Stap 4: Test hypothesen of maak schattingen met inferentiële statistieken
een getal dat een steekproef beschrijft wordt een statistiek genoemd, terwijl een getal dat een populatie beschrijft een parameter wordt genoemd. Met behulp van inferentiële statistieken kunt u conclusies trekken over populatieparameters op basis van steekproefstatistieken.
onderzoekers gebruiken vaak twee hoofdmethoden (gelijktijdig) om gevolgtrekkingen te maken in de statistiek.
- schatting: berekening van populatieparameters op basis van steekproefstatistieken.
- hypothesen: een formeel proces voor het testen van onderzoek voorspellingen over de bevolking met behulp van monsters.
schatting
u kunt twee soorten schattingen maken van populatieparameters uit steekproefstatistieken:
- een puntschatting: een waarde die uw beste schatting van de exacte parameter vertegenwoordigt.
- een intervalschatting: een bereik van waarden die uw beste schatting geven van waar de parameter ligt.
als u populatiekenmerken wilt afleiden en rapporteren uit steekproefgegevens, kunt u het beste zowel punt-als intervalschattingen gebruiken in uw paper.
u kunt een steekproefstatistiek beschouwen als een puntschatting voor de populatieparameter wanneer u een representatieve steekproef hebt (bijvoorbeeld, in een brede publieke opiniepeiling, wordt het aandeel van een steekproef dat de huidige regering ondersteunt genomen als het aandeel van de bevolking van regeringsaanhangers).
er is altijd een fout betrokken bij de schatting, dus u moet ook een betrouwbaarheidsinterval opgeven als een intervalschatting om de variabiliteit rond een puntschatting te laten zien.
een betrouwbaarheidsinterval gebruikt de standaardfout en de Z-score van de standaard normale verdeling om aan te geven waar u meestal de populatieparameter zou verwachten.
hypothese testen
met behulp van gegevens uit een steekproef kunt u hypothesen testen over relaties tussen variabelen in de populatie. Hypothese testen begint met de aanname dat de nulhypothese waar is in de populatie, en je gebruikt statistische tests om te beoordelen of de nulhypothese kan worden afgewezen of niet.
statistische tests bepalen waar uw steekproefgegevens zouden liggen op een verwachte verdeling van steekproefgegevens als de nulhypothese waar zou zijn. Deze tests leveren twee belangrijke resultaten op.:
- een teststatistiek vertelt u hoeveel uw gegevens verschillen van de nulhypothese van de test.
- een p-waarde geeft u de kans om uw resultaten te verkrijgen als de nulhypothese daadwerkelijk waar is in de populatie.
statistische tests worden uitgevoerd in drie grote variëteiten:
- vergelijkingstests beoordelen groepsverschillen in resultaten.
- regressietests beoordelen de oorzaak-en-gevolg relaties tussen variabelen.
- Correlatietests beoordelen de relaties tussen variabelen zonder een oorzakelijk verband aan te nemen.
uw keuze van de statistische test hangt af van uw onderzoeksvragen, onderzoeksopzet, bemonsteringsmethode en gegevenskarakteristieken.
parametrische tests
parametrische tests maken krachtige gevolgtrekkingen over de populatie op basis van steekproefgegevens. Maar om ze te gebruiken, moet aan sommige aannames worden voldaan, en slechts enkele soorten variabelen kunnen worden gebruikt. Als uw gegevens deze aannames schenden, kunt u in plaats daarvan passende gegevenstransformaties Uitvoeren of alternatieve niet-parametrische tests gebruiken.
een regressie modelleert de mate waarin veranderingen in een voorspellende variabele resulteren in veranderingen in uitkomstvariabelen.
- een eenvoudige lineaire regressie omvat één voorspellende variabele en één uitkomstvariabele.
- een meervoudige lineaire regressie omvat twee of meer voorspellende variabelen en één uitkomstvariabele.
vergelijkingstests vergelijken gewoonlijk de gemiddelden van groepen. Dit kunnen de middelen zijn van verschillende groepen binnen een steekproef (bijvoorbeeld een behandelings-en controlegroep), de middelen van één steekproefgroep die op verschillende tijdstippen is genomen (bijvoorbeeld pretest-en posttestscores), of een steekproefgemiddelde en een populatiegemiddelde.
- een t-test is voor precies 1 of 2 groepen wanneer het monster klein is (30 of minder).
- een z-test is voor precies 1 of 2 groepen wanneer het monster groot is.
- een ANOVA is voor 3 of meer groepen.
de Z-en t-tests hebben subtypes gebaseerd op het aantal en de soorten monsters en de hypothesen:
- als u slechts één monster hebt dat u wilt vergelijken met een populatiegemiddelde, gebruik dan een test met één monster.
- als u gepaarde metingen hebt (ontwerp binnen proefpersonen), gebruik dan een afhankelijke (gepaarde) monstertest.
- als u volledig gescheiden metingen hebt van twee ongeëvenaarde groepen (ontwerp tussen proefpersonen), gebruik dan een onafhankelijke test.
- als u een verschil tussen groepen in een bepaalde richting verwacht, gebruik dan een eenzijdige test.
- als u geen verwachtingen hebt over de richting van een verschil tussen groepen, gebruik dan een tweestaarttest.
de enige parametrische correlatietest is de r van Pearson. de correlatiecoëfficiënt (r) geeft de sterkte aan van een lineaire relatie tussen twee kwantitatieve variabelen.
om echter te testen of de correlatie in de steekproef sterk genoeg is om belangrijk te zijn in de populatie, moet u ook een significantietest van de correlatiecoëfficiënt uitvoeren, meestal een t-test, om een p-waarde te verkrijgen. Deze test gebruikt uw steekproefgrootte om te berekenen hoeveel de correlatiecoëfficiënt verschilt van nul in de populatie.
- experimenteel
- correlatie
Stap 5: Interpreteer uw resultaten
de laatste stap van de statistische analyse is het interpreteren van uw resultaten.
statistische significantie
bij het testen van hypothesen is statistische significantie de belangrijkste criteria voor het vormen van conclusies. U vergelijkt uw P-waarde met een ingesteld significantieniveau (meestal 0,05) om te beslissen of uw resultaten statistisch significant of niet-significant zijn.
statistisch significante resultaten worden onwaarschijnlijk geacht uitsluitend door toeval te zijn ontstaan. Er is slechts een zeer geringe kans op een dergelijk resultaat als de nulhypothese waar is in de populatie.
- experimenteel
- correlatie
effectgrootte
een statistisch significant resultaat betekent niet noodzakelijk dat er belangrijke toepassingen of klinische resultaten zijn voor een bevinding.
daarentegen geeft de effectgrootte de praktische betekenis van uw resultaten aan. Het is belangrijk om effectgroottes te rapporteren samen met uw inferentiële statistieken voor een volledig beeld van uw resultaten. U moet ook intervalschattingen van effectgroottes rapporteren als u een APA-stijlpapier schrijft.
- experimenteel
- correlatie
Beslissingsfouten
Type I-en type II-fouten zijn fouten die in onderzoeksconclusies zijn gemaakt. Een type I-fout betekent het afwijzen van de nulhypothese wanneer het echt waar is, terwijl een type II-fout betekent het niet afwijzen van de nulhypothese wanneer het onwaar is.
u kunt ernaar streven het risico op deze fouten te minimaliseren door een optimaal significantieniveau te selecteren en een hoog vermogen te garanderen. Echter, er is een trade-off tussen de twee fouten, dus een fijne balans is noodzakelijk.
Frequentist versus Bayesian statistics
traditioneel legt frequentist statistics de nadruk op nulhypothese significantie testen en begint altijd met de aanname van een echte nulhypothese.
echter, Bayesiaanse statistieken zijn in populariteit gegroeid als een alternatieve benadering in de afgelopen decennia. In deze aanpak gebruikt u eerder onderzoek om uw hypothesen voortdurend bij te werken op basis van uw verwachtingen en waarnemingen.Bayes factor vergelijkt de relatieve sterkte van het bewijs voor de nulhypothese versus de alternatieve hypothese in plaats van een conclusie te maken over het al dan niet afwijzen van de nulhypothese.
Veelgestelde vragen over statistische analyse
beschrijvende statistieken geven een samenvatting van de kenmerken van een gegevensverzameling. Inferentiële statistieken stellen u in staat om een hypothese te testen of te beoordelen of uw gegevens generaliseerbaar zijn voor de bredere populatie.
bij het testen van statistische hypothesen voorspelt de nulhypothese van een test altijd geen effect of geen relatie tussen variabelen, terwijl de alternatieve hypothese uw onderzoekvoorspelling van een effect of relatie aangeeft.
statistische significantie is een term die door onderzoekers wordt gebruikt om aan te geven dat het onwaarschijnlijk is dat hun waarnemingen hebben plaatsgevonden onder de nulhypothese van een statistische test. Betekenis wordt meestal aangeduid met een p-waarde, of waarschijnlijkheidswaarde.
statistische significantie is willekeurig – Het hangt af van de door de onderzoeker gekozen drempelwaarde of alfawaarde. De meest voorkomende drempelwaarde is p < 0,05, wat betekent dat de gegevens waarschijnlijk minder dan 5% van de tijd zullen voorkomen onder de nulhypothese.
wanneer de p-waarde onder de gekozen alfa-waarde valt, zeggen we dat het resultaat van de test statistisch significant is.