statistische analyse betekent het onderzoeken van trends, patronen en relaties met behulp van kwantitatieve gegevens. Het is een belangrijk onderzoeksinstrument dat wordt gebruikt door wetenschappers, overheden, bedrijven en andere organisaties.

om geldige conclusies te kunnen trekken, vereist de statistische analyse een zorgvuldige planning vanaf het begin van het onderzoeksproces. U moet uw hypothesen specificeren en beslissingen nemen over uw onderzoeksontwerp, steekproefgrootte en bemonsteringsprocedure.

na het verzamelen van gegevens uit uw steekproef, kunt u de gegevens ordenen en samenvatten met behulp van beschrijvende statistieken. Vervolgens kunt u inferentiële statistieken gebruiken om hypothesen formeel te testen en schattingen te maken over de populatie. Tenslotte kunt u uw bevindingen interpreteren en veralgemenen.

dit artikel is een praktische inleiding tot de statistische analyse voor studenten en onderzoekers. We nemen je mee door de stappen aan de hand van twee onderzoeksvoorbeelden. De eerste onderzoekt een potentiële oorzaak-en-gevolg relatie, terwijl de tweede onderzoekt een potentiële correlatie tussen variabelen.

voorbeeld: Causale onderzoeksvraag
kan meditatie de examenprestaties bij tieners verbeteren?
voorbeeld: Correlationele onderzoeksvraag
Is er een verband tussen het inkomen van de ouders en het gemiddelde van de punten van het college (GPA)?

Stap 1: Schrijf uw hypothesen en plan uw onderzoeksopzet

om geldige gegevens voor statistische analyse te verzamelen, moet u eerst uw hypothesen specificeren en uw onderzoeksopzet plannen.

statistische hypothesen schrijven

het doel van het onderzoek is vaak om een relatie tussen variabelen binnen een populatie te onderzoeken. Je begint met een voorspelling, en gebruikt statistische analyse om die voorspelling te testen.Een statistische hypothese is een formele manier om een voorspelling over een populatie te schrijven. Elke voorspelling van het onderzoek wordt geherformuleerd in nul en alternatieve hypothesen die kunnen worden getest gebruikend steekproefgegevens.

terwijl de nulhypothese altijd geen effect of geen relatie tussen variabelen voorspelt, stelt de alternatieve hypothese uw onderzoek voorspelling van een effect of relatie.

voorbeeld: statistische hypothesen om een effect
  • te testen nulhypothese: een meditatie-oefening van 5 minuten zal geen effect hebben op de wiskundetestscores bij tieners.
  • alternatieve hypothese: een meditatie-oefening van 5 minuten zal de wiskundetestscores bij tieners verbeteren.

voorbeeld: Statistische hypothesen om een correlatie
  • te testen nulhypothese: Ouderinkomen en GPA hebben geen relatie met elkaar bij studenten.
  • alternatieve hypothese: Ouderinkomen en GPA zijn positief gecorreleerd bij universiteitsstudenten.

Planning uw onderzoeksontwerp

een onderzoeksontwerp is uw algemene strategie voor het verzamelen en analyseren van gegevens. Het bepaalt de statistische tests die u kunt gebruiken om uw hypothese later te testen.

bepaal eerst of uw onderzoek een beschrijvend, correlatief of experimenteel ontwerp zal gebruiken. Experimenten hebben een directe invloed op variabelen, terwijl beschrijvende en correlatiestudies alleen variabelen meten.

  • in een experimenteel ontwerp kunt u een oorzaak-en-effectrelatie (bijvoorbeeld het effect van meditatie op testscores) beoordelen met behulp van statistische vergelijkings-of regressie-tests.
  • in een correlatieontwerp kunt u relaties tussen variabelen (bijv., ouderlijk inkomen en GPA) zonder enige aanname van causaliteit met behulp van correlatiecoëfficiënten en significantie tests.
  • in een beschrijvend ontwerp kunt u de kenmerken van een populatie of fenomeen (bijvoorbeeld de prevalentie van angst bij Amerikaanse studenten) bestuderen met behulp van statistische tests om conclusies te trekken uit steekproefgegevens.

uw onderzoeksopzet heeft ook betrekking op de vraag of u deelnemers op groepsniveau, individueel niveau of beide zult vergelijken.

  • in een ontwerp tussen proefpersonen vergelijkt u de resultaten op groepsniveau van deelnemers die zijn blootgesteld aan verschillende behandelingen (bijvoorbeeld degenen die een meditatie-oefening hebben uitgevoerd versus degenen die dat niet deden).
  • in een binnen-proefpersonen ontwerp, vergelijk je herhaalde metingen van deelnemers die hebben deelgenomen aan alle behandelingen van een studie (bijvoorbeeld scores van voor en na het uitvoeren van een meditatie oefening).
  • Experimenteel
  • Correlatie
Voorbeeld: Experimenteel onderzoeksontwerp
je ontwerpt een experiment binnen proefpersonen om te onderzoeken of een meditatie-oefening van 5 minuten de score van wiskunde-testen kan verbeteren. Je studie neemt herhaalde maatregelen van één groep deelnemers.

eerst neemt u de baseline test scores van de deelnemers. Vervolgens ondergaan uw deelnemers een meditatie-oefening van 5 minuten. Tot slot neem je de scores van de deelnemers op van een tweede wiskundetoets.

in dit experiment is de onafhankelijke variabele de meditatie-oefening van 5 minuten, en de afhankelijke variabele is de verandering in de wiskundetestscores van voor en na de interventie.

voorbeeld: Correlationele onderzoeksopzet
in een correlationele studie test je of er een relatie is tussen ouderinkomen en GPA bij afgestudeerden. Om uw gegevens te verzamelen, vraagt u de deelnemers om een enquête in te vullen en zelf het inkomen van hun ouders en hun eigen GPA te rapporteren.

er zijn geen afhankelijke of onafhankelijke variabelen in deze studie, omdat u alleen variabelen wilt meten zonder ze op enigerlei wijze te beïnvloeden.

meetvariabelen

bij het plannen van een onderzoeksontwerp dient u uw variabelen te operationaliseren en precies te bepalen hoe u ze wilt meten.

voor statistische analyse is het belangrijk om rekening te houden met het meetniveau van uw variabelen, die u vertelt wat voor soort gegevens ze bevatten:

  • categorische gegevens vertegenwoordigen groeperingen. Deze kunnen nominaal zijn (bijv., geslacht) of ordinaal (bv. taalvaardigheid).
  • kwantitatieve gegevens zijn bedragen. Deze kunnen op een interval schaal (bijvoorbeeld test score) of een ratio schaal (bijvoorbeeld leeftijd).

veel variabelen kunnen met verschillende nauwkeurigheidsniveaus worden gemeten. Leeftijdgegevens kunnen bijvoorbeeld kwantitatief (8 jaar oud) of categorisch (jong) zijn. Als een variabele numeriek wordt gecodeerd (bijvoorbeeld niveau van overeenkomst van 1-5), betekent dit niet automatisch dat het kwantitatief is in plaats van categorisch.

het bepalen van het meetniveau is belangrijk voor het kiezen van geschikte statistieken en hypothesetests. U kunt bijvoorbeeld een gemiddelde score berekenen met kwantitatieve gegevens, maar niet met categorische gegevens.

in een onderzoek, samen met metingen van uw variabelen van belang, zult u vaak gegevens verzamelen over relevante karakteristieken van deelnemers.

  • Experimenteel
  • Correlatie
Voorbeeld: Variabelen (experiment)
u kunt veel berekeningen uitvoeren met kwantitatieve leeftijd-of testscore-gegevens, terwijl categorische variabelen kunnen worden gebruikt om groepen voor vergelijkingstesten te bepalen.

Variabele Type gegevens
Leeftijd Kwantitatief (ratio)
Geslacht Categorische (nominale)
Ras of etniciteit Categorische (nominale)
Baseline test scores Kwantitatief (interval)
Laatste test scores Kwantitatief (interval)
Voorbeeld: Variabelen (correlatiestudie)
de typen variabelen in een correlatiestudie bepalen de test die u zult gebruiken voor een correlatiecoëfficiënt. Een parametrische correlatietest kan worden gebruikt voor kwantitatieve gegevens, terwijl een niet-parametrische correlatietest moet worden gebruikt als een van de variabelen ordinaal is.

variabele soort gegevens
ouderlijk inkomen kwantitatief (verhouding)
GPA kwantitatief (interval)

Stap 2: Verzamel gegevens uit een steekproef

populatie vs steekproef

populatie vs steekproef

in de meeste gevallen is het te moeilijk of te duur om gegevens te verzamelen van elk lid van de populatie die u wilt bestuderen. In plaats daarvan verzamelt u gegevens uit een monster.

statistische analyse stelt u in staat om uw bevindingen buiten uw eigen steekproef toe te passen, zolang u de juiste bemonsteringsprocedures gebruikt. Je moet streven naar een steekproef die representatief is voor de bevolking.

steekproef voor statistische analyse

er zijn twee belangrijke benaderingen voor de selectie van een steekproef.Kanssteekproeven :elk lid van de populatie heeft een kans om door middel van willekeurige selectie voor het onderzoek te worden geselecteerd.

  • niet-waarschijnlijkheidsbemonstering: sommige leden van de populatie zijn waarschijnlijker dan anderen om voor het onderzoek te worden geselecteerd vanwege criteria zoals gemak of vrijwillige zelfselectie.
  • in theorie dient u voor zeer generaliseerbare bevindingen een waarschijnlijkheidsbemonsteringsmethode te gebruiken. Willekeurige selectie vermindert sampling bias en zorgt ervoor dat de gegevens van uw steekproef is eigenlijk typisch voor de populatie. Parametrische tests kunnen worden gebruikt om sterke statistische gevolgtrekkingen te maken wanneer gegevens worden verzameld met behulp van kanssteekproeven.

    maar in de praktijk is het zelden mogelijk om het ideale monster te verzamelen. Terwijl niet-waarschijnlijkheid monsters zijn meer kans om te worden bevooroordeeld, ze zijn veel gemakkelijker te werven en gegevens te verzamelen uit. Niet-parametrische tests zijn geschikter voor niet-kanssteekproeven, maar ze resulteren in zwakkere gevolgtrekkingen over de populatie.

    als u parametrische tests wilt gebruiken voor niet-waarschijnlijkheidsmonsters, moet u het geval maken dat:

    • uw steekproef is representatief voor de populatie waar u uw bevindingen aan veralgemeniseert.
    • uw steekproef heeft geen systematische vertekening.

    houd er rekening mee dat externe validiteit betekent dat u uw conclusies alleen kunt veralgemenen naar anderen die de kenmerken van uw steekproef delen. Bijvoorbeeld, resultaten van westerse, opgeleide, geïndustrialiseerde, rijke en democratische monsters (bijv., studenten in de VS) zijn niet automatisch van toepassing op alle niet-vreemde populaties.

    als u parametrische tests toepast op gegevens van niet-waarschijnlijkheidssteekproeven, moet u in uw discussiegedeelte nader ingaan op de beperkingen van hoe ver uw resultaten kunnen worden gegeneraliseerd.

    Maak een geschikte steekproefprocedure

    op basis van de beschikbare middelen voor uw onderzoek, beslis over hoe u deelnemers zult werven.

    • beschikt u over middelen om op grote schaal reclame te maken voor uw studie, ook buiten uw universitaire omgeving?
    • beschikt u over de middelen om een gevarieerde steekproef te werven die een brede populatie vertegenwoordigt?
    • heeft u tijd om contact op te nemen met leden van moeilijk bereikbare groepen?

    • experimenteel
    • correlatie
    voorbeeld: Sampling (experiment)
    de populatie waarin u geïnteresseerd bent zijn middelbare scholieren in uw stad. Je neemt contact op met drie particuliere scholen en zeven openbare scholen in verschillende districten van de stad om te zien of je je experiment kunt toedienen aan studenten in de 11e klas.

    uw deelnemers worden door hun scholen zelf geselecteerd. Hoewel je een niet-waarschijnlijkheidssteekproef gebruikt, streef je naar een divers en representatief monster.

    voorbeeld: steekproef (correlatiestudie)
    uw belangrijkste doelgroep zijn mannelijke studenten in de VS. Met behulp van sociale media reclame, je werven senior-jaar mannelijke studenten uit een kleinere subbevolking: zeven universiteiten in de omgeving van Boston.

    uw deelnemers geven zich vrijwillig op voor de enquête, waardoor dit een niet-waarschijnlijkheidssteekproef is.

    Bereken voldoende steekproefgrootte

    voordat u deelnemers werft, bepaal uw steekproefgrootte door andere studies in uw vakgebied te bekijken of gebruik te maken van statistieken. Een monster dat te klein is kan niet representatief zijn voor de steekproef, terwijl een monster dat te groot is duurder zal zijn dan nodig.

    er zijn veel rekenmachines voor steekproefgrootte online. Verschillende formules worden gebruikt afhankelijk van of u subgroepen hebt of hoe streng uw studie moet zijn (bijvoorbeeld in klinisch onderzoek). Als vuistregel is een minimum van 30 eenheden of meer per subgroep nodig.

    om deze rekenmachines te gebruiken, moet u deze belangrijke componenten begrijpen en invoeren:

    • Significance level (alpha): het risico van het afwijzen van een echte nulhypothese die u bereid bent te nemen, meestal ingesteld op 5%.
    • statistisch vermogen: de kans dat uw studie een effect van een bepaalde omvang detecteert als dat er is, meestal 80% of meer.
    • verwachte effectgrootte: een gestandaardiseerde indicatie van hoe groot het verwachte resultaat van uw studie zal zijn, meestal gebaseerd op andere soortgelijke studies.
    • populatie standaarddeviatie: een schatting van de populatie-parameter op basis van een eerder onderzoek of een eigen pilotstudie.

    Wat is je plagiaat score?

    vergelijk uw papier met meer dan 60 miljard webpagina ‘ s en 30 miljoen publicaties.

    • beste plagiaatcontrole van 2021
    • plagiaatrapport & percentage
    • grootste plagiaatdatabase

    Scribbr plagiaatcontrole

    Stap 3: VAT uw gegevens samen met beschrijvende statistieken

    nadat u al uw gegevens hebt verzameld, kunt u ze inspecteren en beschrijvende statistieken berekenen die ze samenvatten.

    inspecteer uw gegevens

    er zijn verschillende manieren om uw gegevens te inspecteren, waaronder de volgende::

    • het organiseren van gegevens van elke variabele in frequentieverdelingstabellen.
    • gegevens weergeven van een belangrijke variabele in een staafdiagram om de verdeling van de antwoorden te bekijken.
    • visualiseren van de relatie tussen twee variabelen met behulp van een scatter plot.

    door uw gegevens in tabellen en grafieken te visualiseren, kunt u beoordelen of uw gegevens een scheefgetrokken of normale verdeling volgen en of er uitschieters of ontbrekende gegevens zijn.

    een normale verdeling betekent dat uw gegevens symmetrisch worden verdeeld rond een centrum waar de meeste waarden liggen, waarbij de waarden aan de staartuiteinden afbouwen.

    gemiddelde, mediaan, modus en standaardafwijking bij een normale verdeling

    gemiddelde, mediaan, modus en standaardafwijking bij een normale verdeling

    daarentegen is een schuine verdeling asymmetrisch en heeft meer waarden aan de ene kant dan aan de andere. De vorm van de distributie is belangrijk om in gedachten te houden, omdat alleen enkele beschrijvende statistieken moeten worden gebruikt met scheve distributies.

    Extreme uitschieters kunnen ook misleidende statistieken produceren, dus u heeft wellicht een systematische aanpak nodig om met deze waarden om te gaan.

    bereken metingen van centrale tendens

    metingen van centrale tendens beschrijven waar de meeste waarden in een gegevensverzameling liggen. Drie hoofdmaten van centrale tendens worden vaak gerapporteerd:

    • modus: de meest populaire respons of waarde in de dataset.
    • mediaan: de waarde in het exacte midden van de dataset bij bestelling van laag naar hoog.
    • gemiddelde: de som van alle waarden gedeeld door het aantal waarden.

    afhankelijk van de vorm van de verdeling en het meetniveau kunnen echter slechts één of twee van deze maatregelen geschikt zijn. Bijvoorbeeld, veel demografische kenmerken kunnen alleen worden beschreven met behulp van de modus of verhoudingen, terwijl een variabele zoals reactietijd helemaal geen modus kan hebben.

    Calculate measures of variability

    variability Measures of variability vertelt u hoe de waarden in een dataset verdeeld zijn. Vier belangrijke variabiliteitsmaten worden vaak gerapporteerd:

    • bereik: de hoogste waarde min de laagste waarde van de gegevensverzameling.
    • Interkwartielafstand: het bereik van de middelste helft van de gegevensverzameling.
    • standaardafwijking: de gemiddelde afstand tussen elke waarde in uw gegevensverzameling en het gemiddelde.
    • variantie: het kwadraat van de standaardafwijking.

    nogmaals, de vorm van de verdeling en het meetniveau moeten uw keuze van variabiliteitsstatistieken bepalen. Het interkwartielbereik is de beste maat voor schuine distributies, terwijl standaarddeviatie en variantie de beste informatie bieden voor normale distributies.

    • experimenteel
    • correlatie
    voorbeeld: beschrijvende statistieken (experiment)
    na het verzamelen van pretest – en posttestgegevens van 30 studenten in de stad, berekent u beschrijvende statistieken. Omdat je normaal gedistribueerde gegevens op een intervalschaal hebt, tabelleer je het gemiddelde, de standaardafwijking, de variantie en het bereik.

    aan de hand van uw tabel moet u controleren of de eenheden van de beschrijvende statistieken vergelijkbaar zijn voor pretest-en posttest-scores. Bijvoorbeeld, zijn de variantie niveaus vergelijkbaar tussen de groepen? Zijn er extreme waarden? Als die er zijn, moet u mogelijk extreme uitschieters in uw gegevensverzameling identificeren en verwijderen of uw gegevens transformeren voordat u een statistische test uitvoert.

    Pretest scores Posttest scores
    gemiddelde 68.44 75.25
    standaarddeviatie 9.43 9.88
    Variantie 88.96 97.96
    Bereik 36.25 45.12
    N 30

    Uit deze tabel kunnen we zien dat de gemiddelde score steeg na de meditatie oefening, en de varianties van de twee scores vergelijkbaar zijn. Vervolgens kunnen we een statistische test uitvoeren om uit te vinden of deze verbetering in testscores statistisch significant is in de populatie.

    voorbeeld: Beschrijvende statistieken (correlatiestudie)
    na het verzamelen van gegevens van 653 studenten, geeft u een tabel met beschrijvende statistieken voor het jaarinkomen van de ouders en het GPA.

    het is belangrijk om te controleren of u een breed scala aan datapunten heeft. Als u dat niet doet, uw gegevens kunnen worden scheefgetrokken naar sommige groepen meer dan anderen (bijvoorbeeld hoge academische presteerders), en slechts beperkte gevolgtrekkingen kunnen worden gemaakt over een relatie.

    ouderlijk inkomen (USD) GPA
    gemiddelde 62,100 3.12
    Standaard afwijking 15,000 0.45
    Variantie 225,000,000 0.16
    Bereik 8,000–378,000 2.64–4.00
    N 653

    Vervolgens kunnen we berekenen een correlatie-coëfficiënt en het uitvoeren van een statistische toets om de betekenis te begrijpen van de relatie tussen de variabelen in de populatie.

    Stap 4: Test hypothesen of maak schattingen met inferentiële statistieken

    een getal dat een steekproef beschrijft wordt een statistiek genoemd, terwijl een getal dat een populatie beschrijft een parameter wordt genoemd. Met behulp van inferentiële statistieken kunt u conclusies trekken over populatieparameters op basis van steekproefstatistieken.

    onderzoekers gebruiken vaak twee hoofdmethoden (gelijktijdig) om gevolgtrekkingen te maken in de statistiek.

    • schatting: berekening van populatieparameters op basis van steekproefstatistieken.
    • hypothesen: een formeel proces voor het testen van onderzoek voorspellingen over de bevolking met behulp van monsters.

    schatting

    u kunt twee soorten schattingen maken van populatieparameters uit steekproefstatistieken:

    • een puntschatting: een waarde die uw beste schatting van de exacte parameter vertegenwoordigt.
    • een intervalschatting: een bereik van waarden die uw beste schatting geven van waar de parameter ligt.

    als u populatiekenmerken wilt afleiden en rapporteren uit steekproefgegevens, kunt u het beste zowel punt-als intervalschattingen gebruiken in uw paper.

    u kunt een steekproefstatistiek beschouwen als een puntschatting voor de populatieparameter wanneer u een representatieve steekproef hebt (bijvoorbeeld, in een brede publieke opiniepeiling, wordt het aandeel van een steekproef dat de huidige regering ondersteunt genomen als het aandeel van de bevolking van regeringsaanhangers).

    er is altijd een fout betrokken bij de schatting, dus u moet ook een betrouwbaarheidsinterval opgeven als een intervalschatting om de variabiliteit rond een puntschatting te laten zien.

    een betrouwbaarheidsinterval gebruikt de standaardfout en de Z-score van de standaard normale verdeling om aan te geven waar u meestal de populatieparameter zou verwachten.

    hypothese testen

    met behulp van gegevens uit een steekproef kunt u hypothesen testen over relaties tussen variabelen in de populatie. Hypothese testen begint met de aanname dat de nulhypothese waar is in de populatie, en je gebruikt statistische tests om te beoordelen of de nulhypothese kan worden afgewezen of niet.

    statistische tests bepalen waar uw steekproefgegevens zouden liggen op een verwachte verdeling van steekproefgegevens als de nulhypothese waar zou zijn. Deze tests leveren twee belangrijke resultaten op.:

    • een teststatistiek vertelt u hoeveel uw gegevens verschillen van de nulhypothese van de test.
    • een p-waarde geeft u de kans om uw resultaten te verkrijgen als de nulhypothese daadwerkelijk waar is in de populatie.

    statistische tests worden uitgevoerd in drie grote variëteiten:

    • vergelijkingstests beoordelen groepsverschillen in resultaten.
    • regressietests beoordelen de oorzaak-en-gevolg relaties tussen variabelen.
    • Correlatietests beoordelen de relaties tussen variabelen zonder een oorzakelijk verband aan te nemen.

    uw keuze van de statistische test hangt af van uw onderzoeksvragen, onderzoeksopzet, bemonsteringsmethode en gegevenskarakteristieken.

    parametrische tests

    parametrische tests maken krachtige gevolgtrekkingen over de populatie op basis van steekproefgegevens. Maar om ze te gebruiken, moet aan sommige aannames worden voldaan, en slechts enkele soorten variabelen kunnen worden gebruikt. Als uw gegevens deze aannames schenden, kunt u in plaats daarvan passende gegevenstransformaties Uitvoeren of alternatieve niet-parametrische tests gebruiken.

    een regressie modelleert de mate waarin veranderingen in een voorspellende variabele resulteren in veranderingen in uitkomstvariabelen.

    • een eenvoudige lineaire regressie omvat één voorspellende variabele en één uitkomstvariabele.
    • een meervoudige lineaire regressie omvat twee of meer voorspellende variabelen en één uitkomstvariabele.

    vergelijkingstests vergelijken gewoonlijk de gemiddelden van groepen. Dit kunnen de middelen zijn van verschillende groepen binnen een steekproef (bijvoorbeeld een behandelings-en controlegroep), de middelen van één steekproefgroep die op verschillende tijdstippen is genomen (bijvoorbeeld pretest-en posttestscores), of een steekproefgemiddelde en een populatiegemiddelde.

    • een t-test is voor precies 1 of 2 groepen wanneer het monster klein is (30 of minder).
    • een z-test is voor precies 1 of 2 groepen wanneer het monster groot is.
    • een ANOVA is voor 3 of meer groepen.

    de Z-en t-tests hebben subtypes gebaseerd op het aantal en de soorten monsters en de hypothesen:

    • als u slechts één monster hebt dat u wilt vergelijken met een populatiegemiddelde, gebruik dan een test met één monster.
    • als u gepaarde metingen hebt (ontwerp binnen proefpersonen), gebruik dan een afhankelijke (gepaarde) monstertest.
    • als u volledig gescheiden metingen hebt van twee ongeëvenaarde groepen (ontwerp tussen proefpersonen), gebruik dan een onafhankelijke test.
    • als u een verschil tussen groepen in een bepaalde richting verwacht, gebruik dan een eenzijdige test.
    • als u geen verwachtingen hebt over de richting van een verschil tussen groepen, gebruik dan een tweestaarttest.

    de enige parametrische correlatietest is de r van Pearson. de correlatiecoëfficiënt (r) geeft de sterkte aan van een lineaire relatie tussen twee kwantitatieve variabelen.

    om echter te testen of de correlatie in de steekproef sterk genoeg is om belangrijk te zijn in de populatie, moet u ook een significantietest van de correlatiecoëfficiënt uitvoeren, meestal een t-test, om een p-waarde te verkrijgen. Deze test gebruikt uw steekproefgrootte om te berekenen hoeveel de correlatiecoëfficiënt verschilt van nul in de populatie.

    • experimenteel
    • correlatie
    voorbeeld: gepaarde t-test voor experimenteel onderzoek
    omdat uw onderzoeksontwerp een experiment binnen proefpersonen is, komen zowel pretest-als posttestmetingen uit dezelfde groep, dus u hebt een afhankelijke (gepaarde ) t-test nodig. Omdat je een verandering in een bepaalde richting voorspelt (een verbetering in testscores), heb je een eenzijdige test nodig.

    u gebruikt een afhankelijke samples, one-tailed t-test om te beoordelen of de meditatie-oefening de wiskunde-testscores significant verbeterde. De test geeft je:

    • een t-waarde (teststatistiek) van 3,00
    • een p-waarde van 0.0028
    voorbeeld: correlatiecoëfficiënt en significantie test
    u gebruikt Pearson ‘ s r om de sterkte van de lineaire relatie tussen ouderinkomen en GPA in uw steekproef te berekenen. De R-waarde van Pearson is 0,12, wat wijst op een kleine correlatie in het monster.

    hoewel Pearson ‘ s r een teststatistiek is, vertelt het je niets over hoe belangrijk de correlatie is in de populatie. Je moet ook testen of deze steekproef correlatiecoëfficiënt groot genoeg is om een correlatie in de populatie aan te tonen.

    een t-test kan ook bepalen in hoeverre een correlatiecoëfficiënt verschilt van nul op basis van de steekproefgrootte. Omdat je een positieve correlatie verwacht tussen ouderlijk inkomen en GPA, gebruik je een one-sample, one-tailed t-test. De t-test geeft je:

    • een t-waarde van 3,08
    • een p-waarde van 0.001

    Stap 5: Interpreteer uw resultaten

    de laatste stap van de statistische analyse is het interpreteren van uw resultaten.

    statistische significantie

    bij het testen van hypothesen is statistische significantie de belangrijkste criteria voor het vormen van conclusies. U vergelijkt uw P-waarde met een ingesteld significantieniveau (meestal 0,05) om te beslissen of uw resultaten statistisch significant of niet-significant zijn.

    statistisch significante resultaten worden onwaarschijnlijk geacht uitsluitend door toeval te zijn ontstaan. Er is slechts een zeer geringe kans op een dergelijk resultaat als de nulhypothese waar is in de populatie.

    • experimenteel
    • correlatie
    voorbeeld: interpreteer uw resultaten (experiment)
    u vergelijkt uw P-waarde van 0,0027 met uw significantiedrempel van 0,05. Omdat uw P-waarde lager is, besluit u de nulhypothese af te wijzen en beschouwt u uw resultaten statistisch significant.

    dit betekent dat u gelooft dat de meditatie-interventie, in plaats van willekeurige factoren, direct de toename van de testscores veroorzaakte.

    voorbeeld: interpreteer uw resultaten (correlatiestudie)
    u vergelijkt uw P-waarde van 0,001 met uw significantiedrempel van 0,05. Met een p-waarde onder deze drempel kunt u de nulhypothese afwijzen. Dit wijst op een statistisch significante correlatie tussen ouderlijk inkomen en GPA bij mannelijke studenten.

    merk op dat correlatie niet altijd causaliteit betekent, omdat er vaak veel onderliggende factoren zijn die bijdragen aan een complexe variabele zoals GPA. Zelfs als een variabele is gerelateerd aan een andere, kan dit te wijten zijn aan een derde variabele beà nvloeden beide van hen, of indirecte verbanden tussen de twee variabelen.

    een grote steekproefgrootte kan ook de statistische significantie van een correlatiecoëfficiënt sterk beïnvloeden doordat zeer kleine correlatiecoëfficiënten significant lijken.

    effectgrootte

    een statistisch significant resultaat betekent niet noodzakelijk dat er belangrijke toepassingen of klinische resultaten zijn voor een bevinding.

    daarentegen geeft de effectgrootte de praktische betekenis van uw resultaten aan. Het is belangrijk om effectgroottes te rapporteren samen met uw inferentiële statistieken voor een volledig beeld van uw resultaten. U moet ook intervalschattingen van effectgroottes rapporteren als u een APA-stijlpapier schrijft.

    • experimenteel
    • correlatie
    voorbeeld: effectgrootte (experiment)
    je berekent Cohen ‘ s d om de grootte van het verschil tussen pretest en posttest scores te vinden.

    met een Cohen ‘ s d van 0.72, er is een gemiddelde tot hoge praktische betekenis aan uw bevinding dat de meditatie oefening verbeterde testscores.

    voorbeeld: effectgrootte (correlatiestudie)
    om de effectgrootte van de correlatiecoëfficiënt te bepalen, vergelijkt u de R-waarde van uw Pearson met de criteria voor effectgrootte van Cohen.

    omdat uw waarde tussen 0,1 en 0,3 ligt, heeft uw vaststelling van een verband tussen ouderlijk inkomen en GPA een zeer gering effect en heeft het een beperkte praktische betekenis.

    Beslissingsfouten

    Type I-en type II-fouten zijn fouten die in onderzoeksconclusies zijn gemaakt. Een type I-fout betekent het afwijzen van de nulhypothese wanneer het echt waar is, terwijl een type II-fout betekent het niet afwijzen van de nulhypothese wanneer het onwaar is.

    u kunt ernaar streven het risico op deze fouten te minimaliseren door een optimaal significantieniveau te selecteren en een hoog vermogen te garanderen. Echter, er is een trade-off tussen de twee fouten, dus een fijne balans is noodzakelijk.

    Frequentist versus Bayesian statistics

    traditioneel legt frequentist statistics de nadruk op nulhypothese significantie testen en begint altijd met de aanname van een echte nulhypothese.

    echter, Bayesiaanse statistieken zijn in populariteit gegroeid als een alternatieve benadering in de afgelopen decennia. In deze aanpak gebruikt u eerder onderzoek om uw hypothesen voortdurend bij te werken op basis van uw verwachtingen en waarnemingen.Bayes factor vergelijkt de relatieve sterkte van het bewijs voor de nulhypothese versus de alternatieve hypothese in plaats van een conclusie te maken over het al dan niet afwijzen van de nulhypothese.

    Veelgestelde vragen over statistische analyse

    Wat is statistische analyse? Statistische analyse is de belangrijkste methode voor het analyseren van kwantitatieve onderzoeksgegevens. Het maakt gebruik van waarschijnlijkheden en modellen om voorspellingen over een populatie uit steekproefgegevens te testen.
    Wat is het verschil tussen beschrijvende en inferentiële statistieken?

    beschrijvende statistieken geven een samenvatting van de kenmerken van een gegevensverzameling. Inferentiële statistieken stellen u in staat om een hypothese te testen of te beoordelen of uw gegevens generaliseerbaar zijn voor de bredere populatie.

    Wat is het testen van hypothesen? Hypothese testen is een formele procedure voor het onderzoeken van onze ideeën over de wereld met behulp van statistieken. Het wordt gebruikt door wetenschappers om specifieke voorspellingen te testen, zogenaamde hypothesen, door te berekenen hoe waarschijnlijk het is dat een patroon of relatie tussen variabelen zou kunnen zijn ontstaan door toeval.
    Wat zijn null en alternatieve hypothesen?

    bij het testen van statistische hypothesen voorspelt de nulhypothese van een test altijd geen effect of geen relatie tussen variabelen, terwijl de alternatieve hypothese uw onderzoekvoorspelling van een effect of relatie aangeeft.

    Wat is statistische significantie?

    statistische significantie is een term die door onderzoekers wordt gebruikt om aan te geven dat het onwaarschijnlijk is dat hun waarnemingen hebben plaatsgevonden onder de nulhypothese van een statistische test. Betekenis wordt meestal aangeduid met een p-waarde, of waarschijnlijkheidswaarde.

    statistische significantie is willekeurig – Het hangt af van de door de onderzoeker gekozen drempelwaarde of alfawaarde. De meest voorkomende drempelwaarde is p < 0,05, wat betekent dat de gegevens waarschijnlijk minder dan 5% van de tijd zullen voorkomen onder de nulhypothese.

    wanneer de p-waarde onder de gekozen alfa-waarde valt, zeggen we dat het resultaat van de test statistisch significant is.

    Geef een antwoord

    Het e-mailadres wordt niet gepubliceerd.