statistisk analyse betyder at undersøge tendenser, mønstre og forhold ved hjælp af kvantitative data. Det er et vigtigt forskningsværktøj, der bruges af forskere, regeringer, virksomheder og andre organisationer.

for at drage gyldige konklusioner kræver statistisk analyse omhyggelig planlægning lige fra starten af forskningsprocessen. Du skal angive dine hypoteser og træffe beslutninger om dit forskningsdesign, stikprøvestørrelse og prøveudtagningsprocedure.

når du har indsamlet data fra din prøve, kan du organisere og opsummere dataene ved hjælp af beskrivende statistik. Derefter kan du bruge inferentiel statistik til formelt at teste hypoteser og foretage skøn over befolkningen. Endelig kan du fortolke og generalisere dine resultater.

denne artikel er en praktisk introduktion til statistisk analyse for studerende og forskere. Vi leder dig gennem trinnene ved hjælp af to forskningseksempler. Den første undersøger et potentielt årsag-og-virkningsforhold, mens den anden undersøger en potentiel sammenhæng mellem variabler.

eksempel: kausal Forskning spørgsmål
kan meditation forbedre eksamen ydeevne i teenagere?
eksempel: Korrelationsforskningsspørgsmål
er der en sammenhæng mellem forældrenes indkomst og college grade point average (GPA)?

Trin 1: Skriv dine hypoteser og planlæg dit forskningsdesign

for at indsamle gyldige data til statistisk analyse skal du først specificere dine hypoteser og planlægge dit forskningsdesign.

skrivning af statistiske hypoteser

målet med forskning er ofte at undersøge et forhold mellem variabler inden for en befolkning. Du starter med en forudsigelse og bruger statistisk analyse til at teste denne forudsigelse.

en statistisk hypotese er en formel måde at skrive en forudsigelse om en befolkning på. Hver forskningsforudsigelse omformuleres til null-og alternative hypoteser, der kan testes ved hjælp af prøvedata.

mens nulhypotesen altid forudsiger ingen effekt eller intet forhold mellem variabler, angiver den alternative hypotese din forskningsforudsigelse af en effekt eller et forhold.

eksempel: statistiske hypoteser til test af en effekt
  • Nulhypotese: en 5-minutters meditationsøvelse vil ikke have nogen effekt på matematiske testresultater hos teenagere.
  • alternativ hypotese: en 5-minutters meditationsøvelse vil forbedre matematiske testresultater hos teenagere.
eksempel: Statistiske hypoteser til test af en korrelation
  • Nulhypotese: Forældreindkomst og GPA har intet forhold til hinanden hos universitetsstuderende.
  • alternativ hypotese: Forældreindkomst og GPA er positivt korreleret hos universitetsstuderende.

planlægning af dit forskningsdesign

et forskningsdesign er din overordnede strategi for dataindsamling og analyse. Det bestemmer de statistiske tests, du kan bruge til at teste din hypotese senere.

først skal du beslutte, om din forskning vil bruge et beskrivende, korrelationsmæssigt eller eksperimentelt design. Eksperimenter påvirker direkte variabler, mens beskrivende og korrelationsundersøgelser kun måler variabler.

  • i et eksperimentelt design kan du vurdere et årsag-og-virkningsforhold (f.eks. effekten af meditation på testresultater) ved hjælp af statistiske test af sammenligning eller regression.
  • i et korrelationsdesign kan du udforske relationer mellem variabler (f. eks., forældrenes indkomst og GPA) uden nogen antagelse om kausalitet ved hjælp af korrelationskoefficienter og signifikanstest.
  • i et beskrivende design kan du studere karakteristika for en befolkning eller et fænomen (f.eks. forekomsten af angst hos amerikanske universitetsstuderende) ved hjælp af statistiske tests til at drage slutninger fra prøvedata.

dit forskningsdesign vedrører også, om du vil sammenligne deltagere på gruppeniveau eller individuelt niveau eller begge dele.

  • i et design mellem forsøgspersoner sammenligner du resultaterne på gruppeniveau af deltagere, der har været udsat for forskellige behandlinger (f.eks. dem, der udførte en meditationsøvelse vs dem, der ikke gjorde det).
  • i et design inden for fag sammenligner du gentagne målinger fra deltagere, der har deltaget i alle behandlinger af en undersøgelse (f.eks. scoringer fra før og efter udførelse af en meditationsøvelse).
  • Eksperimentel
  • Korrelation
Eksempel: Eksperimentel forskningsdesign
du designer et eksperiment inden for fag for at undersøge, om en 5-minutters meditationsøvelse kan forbedre matematiske testresultater. Din undersøgelse tager gentagne foranstaltninger fra en gruppe deltagere.

først tager du baseline testresultater fra deltagere. Derefter gennemgår dine deltagere en 5-minutters meditationsøvelse. Endelig registrerer du deltagernes Score fra en anden matematikprøve.

i dette eksperiment er den uafhængige variabel den 5-minutters meditationsøvelse, og den afhængige variabel er ændringen i matematiske testresultater fra før og efter interventionen.

eksempel: Korrelationsforskningsdesign
i en korrelationsundersøgelse tester du, om der er en sammenhæng mellem forældreindkomst og GPA hos kandidatstuderende. For at indsamle dine data vil du bede deltagerne om at udfylde en undersøgelse og selvrapportere deres forældres indkomst og deres egen GPA.

der er ingen afhængige eller uafhængige variabler i denne undersøgelse, fordi du kun vil måle variabler uden at påvirke dem på nogen måde.

måling af variabler

når du planlægger et forskningsdesign, skal du operationalisere dine variabler og beslutte nøjagtigt, hvordan du vil måle dem.

til statistisk analyse er det vigtigt at overveje niveauet for måling af dine variabler, som fortæller dig, hvilken slags data de indeholder:

  • kategoriske data repræsenterer grupperinger. Disse kan være nominelle (f. eks. køn) eller ordinær (f.eks. niveau af sprogkundskaber).
  • kvantitative data repræsenterer beløb. Disse kan være på en intervalskala (f.eks. testscore) eller en ratio skala (f. eks. alder).

mange variabler kan måles på forskellige niveauer af præcision. For eksempel kan aldersdata være kvantitative (8 år) eller kategoriske (unge). Hvis en variabel er kodet numerisk (f.eks. niveau af aftale fra 1-5), betyder det ikke automatisk, at det er kvantitativt i stedet for kategorisk.

det er vigtigt at identificere måleniveauet for at vælge passende statistikker og hypotesetest. For eksempel kan du beregne en gennemsnitlig score med kvantitative data, men ikke med kategoriske data.

i en forskningsundersøgelse, sammen med målinger af dine variabler af interesse, vil du ofte indsamle data om relevante deltagerkarakteristika.

  • Eksperimentel
  • Korrelation
Eksempel: Variabler (eksperiment)
du kan udføre mange beregninger med kvantitative alders-eller testscoredata, mens kategoriske variabler kan bruges til at bestemme grupperinger til sammenligningstest.

variabel datatype
alder kvantitativ (ratio)
køn kategorisk (nominel)
Race eller etnicitet kategorisk (nominel)
Baseline testresultater kvantitativ (interval)
afsluttende testresultater kvantitativ (interval)
eksempel: Variabler (korrelationsundersøgelse)
variabeltyperne i en korrelationsundersøgelse bestemmer den test, du vil bruge til en korrelationskoefficient. En parametrisk korrelationstest kan bruges til kvantitative data, mens en ikke-parametrisk korrelationstest skal bruges, hvis en af variablerne er ordinær.

variabel datatype
Forældreindkomst kvantitativ (ratio)
GPA kvantitativ (interval)

Trin 2: Indsamle data fra en prøve

 befolkning vs prøve

befolkning vs prøve

i de fleste tilfælde er det for svært eller dyrt at indsamle data fra hvert medlem af befolkningen, du er interesseret i at studere. I stedet indsamler du data fra en prøve.

statistisk analyse giver dig mulighed for at anvende dine fund ud over din egen prøve, så længe du bruger passende prøveudtagningsprocedurer. Du skal sigte mod en prøve, der er repræsentativ for befolkningen.

prøveudtagning til statistisk analyse

der er to hovedmetoder til udvælgelse af en prøve.

  • sandsynlighedsprøvetagning: hvert medlem af befolkningen har en chance for at blive valgt til undersøgelsen gennem tilfældig udvælgelse.
  • ikke-sandsynlighedsprøveudtagning: nogle medlemmer af befolkningen er mere tilbøjelige end andre til at blive udvalgt til undersøgelsen på grund af kriterier som bekvemmelighed eller frivillig selvvalg.

i teorien skal du bruge en sandsynlighedsprøveudtagningsmetode til meget generaliserbare fund. Tilfældig udvælgelse reducerer prøveudtagningsforstyrrelser og sikrer, at data fra din prøve faktisk er typiske for befolkningen. Parametriske tests kan bruges til at lave stærke statistiske slutninger, når data indsamles ved hjælp af sandsynlighedsprøvetagning.

men i praksis er det sjældent muligt at samle den ideelle prøve. Mens ikke-sandsynlighedsprøver er mere tilbøjelige til at være partiske, er de meget lettere at rekruttere og indsamle data fra. Ikke-parametriske tests er mere passende for ikke-sandsynlighedsprøver, men de resulterer i svagere slutninger om befolkningen.

hvis du vil bruge parametriske tests til ikke-sandsynlighedsprøver, skal du gøre sagen:

  • din prøve er repræsentativ for den population, du generaliserer Dine Fund til.
  • din prøve mangler systematisk bias.

Husk, at ekstern gyldighed betyder, at du kun kan generalisere dine konklusioner til andre, der deler egenskaberne ved din prøve. For eksempel resultater fra vestlige, uddannede, industrialiserede, rige og demokratiske prøver (f. eks., universitetsstuderende i USA) gælder ikke automatisk for alle ikke-underlige befolkninger.

hvis du anvender parametriske tests på data fra ikke-sandsynlighedsprøver, skal du sørge for at uddybe begrænsningerne for, hvor langt dine resultater kan generaliseres i dit diskussionsafsnit.

Opret en passende prøveudtagningsprocedure

baseret på de ressourcer, der er tilgængelige til din forskning, skal du beslutte, hvordan du rekrutterer deltagere.

  • vil du have ressourcer til at annoncere dit studie bredt, også uden for din universitetsindstilling?
  • vil du have midlerne til at rekruttere en forskelligartet prøve, der repræsenterer en bred befolkning?
  • har du tid til at kontakte og følge op med medlemmer af svært tilgængelige grupper?
  • eksperimentel
  • korrelation
eksempel: prøveudtagning (eksperiment)
den befolkning, du er interesseret i, er gymnasieelever i din by. Du kontakter tre private skoler og syv offentlige skoler i forskellige distrikter i byen for at se, om du kan administrere dit eksperiment til studerende i 11.klasse.

dine deltagere er selvvalgt af deres skoler. Selvom du bruger en ikke-sandsynlighedsprøve, sigter du mod en forskelligartet og repræsentativ prøve.

eksempel: prøveudtagning(korrelationsundersøgelse)
din største interessepopulation er mandlige universitetsstuderende i USA. Brug af reklame på sociale medier, du rekrutterer seniorårige mandlige universitetsstuderende fra en mindre underbefolkning: syv universiteter i Boston-området.

dine deltagere melder sig frivilligt til undersøgelsen, hvilket gør dette til en ikke-sandsynlighedsprøve.

Beregn tilstrækkelig stikprøvestørrelse

før du rekrutterer deltagere, skal du beslutte din stikprøvestørrelse enten ved at se på andre undersøgelser inden for dit felt eller bruge statistik. En prøve, der er for lille, kan være repræsentativ for prøven, mens en prøve, der er for stor, vil være dyrere end nødvendigt.

der er mange stikprøvestørrelsesregnemaskiner online. Forskellige formler anvendes afhængigt af om du har undergrupper eller hvor streng din undersøgelse skal være (f.eks. Som en tommelfingerregel er mindst 30 enheder eller mere pr.

for at bruge disse regnemaskiner skal du forstå og indtaste disse nøglekomponenter:

  • signifikansniveau (alpha): risikoen for at afvise en sand nulhypotese, som du er villig til at tage, normalt sat til 5%.
  • statistisk effekt: sandsynligheden for, at din undersøgelse registrerer en effekt af en bestemt størrelse, hvis der er en, normalt 80% eller højere.
  • forventet effektstørrelse: en standardiseret indikation af, hvor stort det forventede resultat af din undersøgelse vil være, normalt baseret på andre lignende undersøgelser.
  • Populationsstandardafvigelse: et skøn over populationsparameteren baseret på en tidligere undersøgelse eller en egen pilotundersøgelse.

Hvad er din plagiat score?

sammenlign dit papir med over 60 milliarder hjemmesider og 30 millioner publikationer.

  • bedste plagiatkontrol af 2021
  • Plagiatrapport & procentdel
  • største plagiatdatabase

Scribbr Plagiatkontrol

Trin 3: Opsummer dine data med beskrivende statistik

når du har samlet alle dine data, kan du inspicere dem og beregne beskrivende statistik, der opsummerer dem.

Undersøg dine data

der er forskellige måder at inspicere dine data på, herunder følgende:

  • organisering af data fra hver variabel i frekvensfordelingstabeller.
  • visning af data fra en nøglevariabel i et søjlediagram for at se fordelingen af svar.
  • visualisering af forholdet mellem to variabler ved hjælp af et scatter plot.

ved at visualisere dine data i tabeller og grafer kan du vurdere, om dine data følger en skæv eller normalfordeling, og om der er nogen outliers eller manglende data.

en normalfordeling betyder, at dine data er symmetrisk fordelt omkring et center, hvor de fleste værdier ligger, med værdierne aftagende i haleenderne.

middel, median, modus og standardafvigelse i en normalfordeling

middelværdi, median, tilstand og standardafvigelse i en normalfordeling

i modsætning hertil er en skæv fordeling asymmetrisk og har flere værdier i den ene ende end den anden. Distributionens form er vigtig at huske på, fordi kun nogle beskrivende statistikker skal bruges med skæve distributioner.

ekstreme outliers kan også producere vildledende statistikker, så du kan få brug for en systematisk tilgang til at håndtere disse værdier.

Beregn mål for central tendens

mål for central tendens beskriv, hvor de fleste af værdierne i et datasæt ligger. Tre hovedmålinger af central tendens rapporteres ofte:

  • Mode: det mest populære svar eller værdi i datasættet.
  • Median: værdien i den nøjagtige midten af datasættet, når bestilt fra lav til høj.
  • middel: summen af alle værdier divideret med antallet af værdier.

afhængigt af formen på fordelingen og måleniveauet kan kun en eller to af disse mål være passende. For eksempel kan mange demografiske egenskaber kun beskrives ved hjælp af tilstanden eller proportionerne, mens en variabel som reaktionstid muligvis slet ikke har en tilstand.

Beregn målinger af variabilitet

målinger af variabilitet fortæller dig, hvor spredt værdierne i et datasæt er. Fire hovedmål for variabilitet rapporteres ofte:

  • område: den højeste værdi minus den laveste værdi af datasættet.
  • Interkvartil rækkevidde: området for den midterste halvdel af datasættet.
  • standardafvigelse: den gennemsnitlige afstand mellem hver værdi i dit datasæt og gennemsnittet.
  • varians: kvadratet af standardafvigelsen.

endnu en gang skal formen på fordelingen og måleniveauet styre dit valg af variabilitetsstatistikker. Interkvartilområdet er det bedste mål for skæve fordelinger, mens standardafvigelse og varians giver den bedste information til normale fordelinger.

  • eksperimentel
  • korrelation
eksempel: Beskrivende statistik (eksperiment)
når du har indsamlet prætest-og posttest-data fra 30 studerende i hele byen, beregner du beskrivende statistik. Da du har normalfordelte data på en intervalskala, tabulerer du middelværdien, standardafvigelsen, variansen og området.

ved hjælp af din tabel skal du kontrollere, om enhederne i den beskrivende statistik er sammenlignelige for prætest-og posttest-score. Er variansniveauerne ens på tværs af grupperne? Er der nogen ekstreme værdier? Hvis der er, skal du muligvis identificere og fjerne ekstreme afvigelser i dit datasæt eller transformere dine data, før du udfører en statistisk test.

Pretest scores Posttest scores
middel 68.44 75.25
standardafvigelse 9.43 9.88
varians 88.96 97.96
rækkevidde 36.25 45.12
N 30

fra denne tabel kan vi se, at den gennemsnitlige score steg efter meditationsøvelsen, og varianserne for de to scoringer er sammenlignelige. Dernæst kan vi udføre en statistisk test for at finde ud af, om denne forbedring i testresultater er statistisk signifikant i befolkningen.

eksempel: Beskrivende statistik (korrelationsundersøgelse)
efter indsamling af data fra 653 studerende tabulerer du beskrivende statistik for årlig forældreindkomst og GPA.

det er vigtigt at kontrollere, om du har en bred vifte af datapunkter. Hvis du ikke gør det, kan dine data være skævt over for nogle grupper mere end andre (f.eks.

Forældreindkomst (USD) GPA
middel 62,100 3.12
standardafvigelse 15,000 0.45
varians 225,000,000 0.16
rækkevidde 8,000–378,000 2.64–4.00
N 653

dernæst kan vi beregne en korrelationskoefficient og udføre en statistisk test for at forstå betydningen af forholdet mellem variablerne i befolkningen.

Trin 4: Test hypoteser eller lav estimater med inferentiel statistik

et tal, der beskriver en prøve, kaldes en statistik, mens et tal, der beskriver en population, kaldes en parameter. Ved hjælp af inferentiel statistik kan du drage konklusioner om befolkningsparametre baseret på stikprøvestatistikker.

forskere bruger ofte to hovedmetoder (samtidigt) til at drage konklusioner i statistikker.

  • estimering: beregning af populationsparametre baseret på stikprøvestatistik.
  • hypotesetest: en formel proces til test af forskningsprognoser om befolkningen ved hjælp af prøver.

estimering

du kan lave to typer estimater af populationsparametre fra stikprøvestatistik:

  • et punktestimat: en værdi, der repræsenterer dit bedste gæt af den nøjagtige parameter.
  • et intervalestimat: en række værdier, der repræsenterer dit bedste gæt på, hvor parameteren ligger.

hvis dit mål er at udlede og rapportere populationskarakteristika fra stikprøvedata, er det bedst at bruge både punkt-og intervalestimater i dit papir.

du kan betragte en stikprøvestatistik som et punktestimat for populationsparameteren, når du har en repræsentativ stikprøve (f.eks. i en bred meningsmåling tages andelen af en stikprøve, der understøtter den nuværende regering, som befolkningsandelen af regeringens tilhængere).

der er altid fejl involveret i estimering, så du bør også angive et konfidensinterval som et intervalestimat for at vise variabiliteten omkring et punktestimat.

et konfidensinterval bruger standardfejlen og å-scoren fra standard normalfordeling til at formidle, hvor du generelt forventer at finde populationsparameteren det meste af tiden.

hypotesetest

ved hjælp af data fra en prøve kan du teste hypoteser om forhold mellem variabler i befolkningen. Hypotesetestning starter med antagelsen om, at nulhypotesen er sand i befolkningen, og du bruger statistiske tests til at vurdere, om nulhypotesen kan afvises eller ej.

statistiske tests bestemmer, hvor dine prøvedata ville ligge på en forventet fordeling af prøvedata, hvis nulhypotesen var sand. Disse tests giver to hovedudgange:

  • en teststatistik fortæller dig, hvor meget dine data adskiller sig fra testens nulhypotese.
  • en p-værdi fortæller dig sandsynligheden for at opnå dine resultater, hvis nulhypotesen faktisk er sand i befolkningen.

statistiske tests kommer i tre hovedvarianter:

  • sammenligningstest vurderer gruppeforskelle i resultater.
  • regressionstest vurderer årsag-og-virkningsforhold mellem variabler.
  • Korrelationstest vurderer forholdet mellem variabler uden at antage årsagssammenhæng.

dit valg af statistisk test afhænger af dine forskningsspørgsmål, forskningsdesign, prøveudtagningsmetode og datakarakteristika.

parametriske tests

parametriske tests gør kraftige slutninger om befolkningen baseret på prøvedata. Men for at bruge dem skal nogle antagelser være opfyldt, og kun nogle typer variabler kan bruges. Hvis dine data overtræder disse antagelser, kan du udføre passende datatransformationer eller bruge alternative ikke-parametriske tests i stedet.

en regressionsmodeller i hvilket omfang ændringer i en forudsigelsesvariabel resulterer i ændringer i udfaldsvariabler.

  • en simpel lineær regression inkluderer en forudsigelsesvariabel og en resultatvariabel.
  • en multipel lineær regression inkluderer to eller flere forudsigelsesvariabler og en resultatvariabel.

sammenligningstest sammenligner normalt gruppernes midler. Disse kan være midlerne til forskellige grupper inden for en prøve (f.eks. en behandlings-og kontrolgruppe), midlerne til en prøvegruppe taget på forskellige tidspunkter (f. eks.

  • en T-test er for nøjagtigt 1 eller 2 grupper, når prøven er lille (30 eller mindre).
  • en å-test er for nøjagtigt 1 eller 2 grupper, når prøven er stor.
  • en ANOVA er for 3 eller flere grupper.

Å-og t-testene har undertyper baseret på antallet og typerne af prøver og hypoteserne:

  • hvis du kun har en prøve, som du vil sammenligne med et populationsgennemsnit, skal du bruge en test med en prøve.
  • hvis du har parrede målinger (inden-fag design), bruge en afhængig (parrede) prøver test.
  • hvis du har helt separate målinger fra to uovertruffen grupper (mellem-fag design), bruge en uafhængig prøver test.
  • hvis du forventer en forskel mellem grupper i en bestemt retning, skal du bruge en one-tailed test.
  • hvis du ikke har nogen forventninger til retningen af en forskel mellem grupper, skal du bruge en to-tailed test.

den eneste parametriske korrelationstest er Pearsons r. korrelationskoefficienten (r) fortæller dig styrken af et lineært forhold mellem to kvantitative variabler.

for at teste, om korrelationen i prøven er stærk nok til at være vigtig i befolkningen, skal du også udføre en signifikanstest af korrelationskoefficienten, normalt en t-test, for at opnå en p-værdi. Denne test bruger din stikprøvestørrelse til at beregne, hvor meget korrelationskoefficienten adskiller sig fra nul i befolkningen.

  • eksperimentel
  • korrelation
eksempel: parret t-test til eksperimentel forskning
da dit forskningsdesign er et eksperiment inden for fag, kommer både prætest-og posttest-målinger fra den samme gruppe, så du har brug for en afhængig (parret ) t-test. Da du forudsiger en ændring i en bestemt retning (en forbedring af testresultater), har du brug for en one-tailed test.

du bruger en dependent-samples, one-tailed t-test for at vurdere, om meditationsøvelsen signifikant forbedrede matematiske testresultater. Testen giver dig:

  • en T-værdi (teststatistik) på 3,00
  • en p-værdi på 0.0028
eksempel: korrelationskoefficient og signifikanstest
du bruger Pearsons r til at beregne styrken af det lineære forhold mellem forældrenes indkomst og GPA i din prøve. Pearsons R-værdi er 0,12, hvilket indikerer en lille korrelation i prøven.

selvom Pearsons r er en teststatistik, fortæller den dig ikke noget om, hvor signifikant korrelationen er i befolkningen. Du skal også teste, om denne prøvekorrelationskoefficient er stor nok til at demonstrere en sammenhæng i befolkningen.

en T-test kan også bestemme, hvor signifikant en korrelationskoefficient adskiller sig fra nul baseret på stikprøvestørrelse. Da du forventer en positiv sammenhæng mellem forældrenes indkomst og GPA, bruger du en en-prøve, en-tailed t-test. T-testen giver dig:

  • en T-værdi på 3,08
  • en p-værdi på 0.001

Trin 5: Fortolk dine resultater

det sidste trin i statistisk analyse er at fortolke dine resultater.

statistisk signifikans

i hypotesetestning er statistisk signifikans de vigtigste kriterier for dannelse af konklusioner. Du sammenligner din p-værdi med et sæt signifikansniveau (normalt 0,05) for at afgøre, om dine resultater er statistisk signifikante eller ikke-signifikante.

statistisk signifikante resultater anses for usandsynligt at være opstået udelukkende på grund af tilfældigheder. Der er kun en meget lav chance for, at et sådant resultat opstår, hvis nulhypotesen er sand i befolkningen.

  • eksperimentel
  • korrelation
eksempel: Fortolk dine resultater(eksperiment)
du sammenligner din p-værdi på 0,0027 med din signifikanstærskel på 0,05. Da din p-værdi er lavere, beslutter du at afvise nulhypotesen, og du betragter dine resultater som statistisk signifikante.

dette betyder, at du tror, at meditationsinterventionen snarere end tilfældige faktorer direkte forårsagede stigningen i testresultater.

eksempel: Fortolk dine resultater(korrelationsundersøgelse)
du sammenligner din p-værdi på 0,001 med din signifikanstærskel på 0,05. Med en p-værdi under denne tærskel kan du afvise nulhypotesen. Dette indikerer en statistisk signifikant sammenhæng mellem forældrenes indkomst og GPA hos mandlige universitetsstuderende.

bemærk, at korrelation ikke altid betyder årsagssammenhæng, fordi der ofte er mange underliggende faktorer, der bidrager til en kompleks variabel som GPA. Selv hvis en variabel er relateret til en anden, kan dette skyldes, at en tredje variabel påvirker dem begge eller indirekte forbindelser mellem de to variabler.

en stor stikprøvestørrelse kan også stærkt påvirke den statistiske betydning af en korrelationskoefficient ved at gøre meget små korrelationskoefficienter synes signifikante.

effekt størrelse

en statistisk signifikant resultat betyder ikke nødvendigvis, at der er vigtige virkelige liv applikationer eller kliniske resultater for en konstatering.

i modsætning hertil angiver effektstørrelsen den praktiske betydning af dine resultater. Det er vigtigt at rapportere effektstørrelser sammen med dine inferentielle statistikker for at få et komplet billede af dine resultater. Du bør også rapportere interval estimater af effektstørrelser, hvis du skriver en APA stil papir.

  • eksperimentel
  • korrelation
eksempel: effektstørrelse(eksperiment)
du beregner Cohens d for at finde størrelsen på forskellen mellem prætest og posttest score.

med en Cohens d af 0.72, der er medium til høj praktisk betydning for din konstatering af, at meditationsøvelsen forbedrede testresultater.

eksempel: effektstørrelse (korrelationsundersøgelse)
for at bestemme effektstørrelsen af korrelationskoefficienten sammenligner du din Pearsons r-værdi med Cohens effektstørrelseskriterier.

fordi din værdi er mellem 0,1 og 0,3, repræsenterer din konstatering af et forhold mellem forældreindkomst og GPA en meget lille effekt og har begrænset praktisk betydning.

Beslutningsfejl

type I-og type II-fejl er fejl, der er begået i forskningskonklusioner. En type i-fejl betyder at afvise nulhypotesen, når den faktisk er sand, mens en type II-fejl betyder ikke at afvise nulhypotesen, når den er falsk.

du kan sigte mod at minimere risikoen for disse fejl ved at vælge et optimalt signifikansniveau og sikre høj effekt. Der er dog en afvejning mellem de to fejl, så en fin balance er nødvendig.

frekvens versus Bayesian statistik

traditionelt lægger frekvensstatistik vægt på nulhypotese signifikanstest og starter altid med antagelsen om en sand nulhypotese.

Bayesian statistik er dog vokset i popularitet som en alternativ tilgang i de sidste par årtier. I denne tilgang bruger du tidligere forskning til løbende at opdatere dine hypoteser baseret på dine forventninger og observationer.

Bayes factor sammenligner den relative styrke af bevis for nul versus den alternative hypotese snarere end at konkludere om at afvise nulhypotesen eller ej.

ofte stillede spørgsmål om statistisk analyse

hvad er statistisk analyse?

statistisk analyse er den vigtigste metode til analyse af kvantitative forskningsdata. Det bruger sandsynligheder og modeller til at teste forudsigelser om en population fra stikprøvedata.

Hvad er forskellen mellem beskrivende og inferentiel statistik?

Beskrivende statistik opsummerer karakteristika for et datasæt. Inferentiel statistik giver dig mulighed for at teste en hypotese eller vurdere, om dine data kan generaliseres til den bredere befolkning.

Hvad er hypotesetest?

hypotesetestning er en formel procedure til undersøgelse af vores ideer om verden ved hjælp af statistikker. Det bruges af forskere til at teste specifikke forudsigelser, kaldet hypoteser, ved at beregne, hvor sandsynligt det er, at et mønster eller forhold mellem variabler kunne være opstået ved en tilfældighed.

hvad er null og alternative hypoteser?

i statistisk hypotesetest forudsiger nulhypotesen for en test altid ingen effekt eller intet forhold mellem variabler, mens den alternative hypotese angiver din forskningsforudsigelse af en effekt eller et forhold.

hvad er statistisk signifikans?

statistisk signifikans er et udtryk, som forskere bruger til at sige, at det er usandsynligt, at deres observationer kunne have fundet sted under nulhypotesen af en statistisk test. Betydning er normalt betegnet med en p-værdi eller sandsynlighedsværdi.

statistisk signifikans er vilkårlig – det afhænger af tærsklen eller alfa-værdien valgt af forskeren. Den mest almindelige tærskel er p < 0,05, hvilket betyder, at dataene sandsynligvis vil forekomme mindre end 5% af tiden under nulhypotesen.

når p-værdien falder under den valgte alfa-værdi, siger vi, at resultatet af testen er statistisk signifikant.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.