statistisk analyse betyder at undersøge tendenser, mønstre og forhold ved hjælp af kvantitative data. Det er et vigtigt forskningsværktøj, der bruges af forskere, regeringer, virksomheder og andre organisationer.
for at drage gyldige konklusioner kræver statistisk analyse omhyggelig planlægning lige fra starten af forskningsprocessen. Du skal angive dine hypoteser og træffe beslutninger om dit forskningsdesign, stikprøvestørrelse og prøveudtagningsprocedure.
når du har indsamlet data fra din prøve, kan du organisere og opsummere dataene ved hjælp af beskrivende statistik. Derefter kan du bruge inferentiel statistik til formelt at teste hypoteser og foretage skøn over befolkningen. Endelig kan du fortolke og generalisere dine resultater.
denne artikel er en praktisk introduktion til statistisk analyse for studerende og forskere. Vi leder dig gennem trinnene ved hjælp af to forskningseksempler. Den første undersøger et potentielt årsag-og-virkningsforhold, mens den anden undersøger en potentiel sammenhæng mellem variabler.
Trin 1: Skriv dine hypoteser og planlæg dit forskningsdesign
for at indsamle gyldige data til statistisk analyse skal du først specificere dine hypoteser og planlægge dit forskningsdesign.
skrivning af statistiske hypoteser
målet med forskning er ofte at undersøge et forhold mellem variabler inden for en befolkning. Du starter med en forudsigelse og bruger statistisk analyse til at teste denne forudsigelse.
en statistisk hypotese er en formel måde at skrive en forudsigelse om en befolkning på. Hver forskningsforudsigelse omformuleres til null-og alternative hypoteser, der kan testes ved hjælp af prøvedata.
mens nulhypotesen altid forudsiger ingen effekt eller intet forhold mellem variabler, angiver den alternative hypotese din forskningsforudsigelse af en effekt eller et forhold.
planlægning af dit forskningsdesign
et forskningsdesign er din overordnede strategi for dataindsamling og analyse. Det bestemmer de statistiske tests, du kan bruge til at teste din hypotese senere.
først skal du beslutte, om din forskning vil bruge et beskrivende, korrelationsmæssigt eller eksperimentelt design. Eksperimenter påvirker direkte variabler, mens beskrivende og korrelationsundersøgelser kun måler variabler.
- i et eksperimentelt design kan du vurdere et årsag-og-virkningsforhold (f.eks. effekten af meditation på testresultater) ved hjælp af statistiske test af sammenligning eller regression.
- i et korrelationsdesign kan du udforske relationer mellem variabler (f. eks., forældrenes indkomst og GPA) uden nogen antagelse om kausalitet ved hjælp af korrelationskoefficienter og signifikanstest.
- i et beskrivende design kan du studere karakteristika for en befolkning eller et fænomen (f.eks. forekomsten af angst hos amerikanske universitetsstuderende) ved hjælp af statistiske tests til at drage slutninger fra prøvedata.
dit forskningsdesign vedrører også, om du vil sammenligne deltagere på gruppeniveau eller individuelt niveau eller begge dele.
- i et design mellem forsøgspersoner sammenligner du resultaterne på gruppeniveau af deltagere, der har været udsat for forskellige behandlinger (f.eks. dem, der udførte en meditationsøvelse vs dem, der ikke gjorde det).
- i et design inden for fag sammenligner du gentagne målinger fra deltagere, der har deltaget i alle behandlinger af en undersøgelse (f.eks. scoringer fra før og efter udførelse af en meditationsøvelse).
- Eksperimentel
- Korrelation
måling af variabler
når du planlægger et forskningsdesign, skal du operationalisere dine variabler og beslutte nøjagtigt, hvordan du vil måle dem.
til statistisk analyse er det vigtigt at overveje niveauet for måling af dine variabler, som fortæller dig, hvilken slags data de indeholder:
- kategoriske data repræsenterer grupperinger. Disse kan være nominelle (f. eks. køn) eller ordinær (f.eks. niveau af sprogkundskaber).
- kvantitative data repræsenterer beløb. Disse kan være på en intervalskala (f.eks. testscore) eller en ratio skala (f. eks. alder).
mange variabler kan måles på forskellige niveauer af præcision. For eksempel kan aldersdata være kvantitative (8 år) eller kategoriske (unge). Hvis en variabel er kodet numerisk (f.eks. niveau af aftale fra 1-5), betyder det ikke automatisk, at det er kvantitativt i stedet for kategorisk.
det er vigtigt at identificere måleniveauet for at vælge passende statistikker og hypotesetest. For eksempel kan du beregne en gennemsnitlig score med kvantitative data, men ikke med kategoriske data.
i en forskningsundersøgelse, sammen med målinger af dine variabler af interesse, vil du ofte indsamle data om relevante deltagerkarakteristika.
- Eksperimentel
- Korrelation
variabel | datatype |
---|---|
alder | kvantitativ (ratio) |
køn | kategorisk (nominel) |
Race eller etnicitet | kategorisk (nominel) |
Baseline testresultater | kvantitativ (interval) |
afsluttende testresultater | kvantitativ (interval) |
variabel | datatype |
---|---|
Forældreindkomst | kvantitativ (ratio) |
GPA | kvantitativ (interval) |
Trin 2: Indsamle data fra en prøve
i de fleste tilfælde er det for svært eller dyrt at indsamle data fra hvert medlem af befolkningen, du er interesseret i at studere. I stedet indsamler du data fra en prøve.
statistisk analyse giver dig mulighed for at anvende dine fund ud over din egen prøve, så længe du bruger passende prøveudtagningsprocedurer. Du skal sigte mod en prøve, der er repræsentativ for befolkningen.
prøveudtagning til statistisk analyse
der er to hovedmetoder til udvælgelse af en prøve.
- sandsynlighedsprøvetagning: hvert medlem af befolkningen har en chance for at blive valgt til undersøgelsen gennem tilfældig udvælgelse.
- ikke-sandsynlighedsprøveudtagning: nogle medlemmer af befolkningen er mere tilbøjelige end andre til at blive udvalgt til undersøgelsen på grund af kriterier som bekvemmelighed eller frivillig selvvalg.
i teorien skal du bruge en sandsynlighedsprøveudtagningsmetode til meget generaliserbare fund. Tilfældig udvælgelse reducerer prøveudtagningsforstyrrelser og sikrer, at data fra din prøve faktisk er typiske for befolkningen. Parametriske tests kan bruges til at lave stærke statistiske slutninger, når data indsamles ved hjælp af sandsynlighedsprøvetagning.
men i praksis er det sjældent muligt at samle den ideelle prøve. Mens ikke-sandsynlighedsprøver er mere tilbøjelige til at være partiske, er de meget lettere at rekruttere og indsamle data fra. Ikke-parametriske tests er mere passende for ikke-sandsynlighedsprøver, men de resulterer i svagere slutninger om befolkningen.
hvis du vil bruge parametriske tests til ikke-sandsynlighedsprøver, skal du gøre sagen:
- din prøve er repræsentativ for den population, du generaliserer Dine Fund til.
- din prøve mangler systematisk bias.
Husk, at ekstern gyldighed betyder, at du kun kan generalisere dine konklusioner til andre, der deler egenskaberne ved din prøve. For eksempel resultater fra vestlige, uddannede, industrialiserede, rige og demokratiske prøver (f. eks., universitetsstuderende i USA) gælder ikke automatisk for alle ikke-underlige befolkninger.
hvis du anvender parametriske tests på data fra ikke-sandsynlighedsprøver, skal du sørge for at uddybe begrænsningerne for, hvor langt dine resultater kan generaliseres i dit diskussionsafsnit.
Opret en passende prøveudtagningsprocedure
baseret på de ressourcer, der er tilgængelige til din forskning, skal du beslutte, hvordan du rekrutterer deltagere.
- vil du have ressourcer til at annoncere dit studie bredt, også uden for din universitetsindstilling?
- vil du have midlerne til at rekruttere en forskelligartet prøve, der repræsenterer en bred befolkning?
- har du tid til at kontakte og følge op med medlemmer af svært tilgængelige grupper?
- eksperimentel
- korrelation
Beregn tilstrækkelig stikprøvestørrelse
før du rekrutterer deltagere, skal du beslutte din stikprøvestørrelse enten ved at se på andre undersøgelser inden for dit felt eller bruge statistik. En prøve, der er for lille, kan være repræsentativ for prøven, mens en prøve, der er for stor, vil være dyrere end nødvendigt.
der er mange stikprøvestørrelsesregnemaskiner online. Forskellige formler anvendes afhængigt af om du har undergrupper eller hvor streng din undersøgelse skal være (f.eks. Som en tommelfingerregel er mindst 30 enheder eller mere pr.
for at bruge disse regnemaskiner skal du forstå og indtaste disse nøglekomponenter:
- signifikansniveau (alpha): risikoen for at afvise en sand nulhypotese, som du er villig til at tage, normalt sat til 5%.
- statistisk effekt: sandsynligheden for, at din undersøgelse registrerer en effekt af en bestemt størrelse, hvis der er en, normalt 80% eller højere.
- forventet effektstørrelse: en standardiseret indikation af, hvor stort det forventede resultat af din undersøgelse vil være, normalt baseret på andre lignende undersøgelser.
- Populationsstandardafvigelse: et skøn over populationsparameteren baseret på en tidligere undersøgelse eller en egen pilotundersøgelse.
Trin 3: Opsummer dine data med beskrivende statistik
når du har samlet alle dine data, kan du inspicere dem og beregne beskrivende statistik, der opsummerer dem.
Undersøg dine data
der er forskellige måder at inspicere dine data på, herunder følgende:
- organisering af data fra hver variabel i frekvensfordelingstabeller.
- visning af data fra en nøglevariabel i et søjlediagram for at se fordelingen af svar.
- visualisering af forholdet mellem to variabler ved hjælp af et scatter plot.
ved at visualisere dine data i tabeller og grafer kan du vurdere, om dine data følger en skæv eller normalfordeling, og om der er nogen outliers eller manglende data.
en normalfordeling betyder, at dine data er symmetrisk fordelt omkring et center, hvor de fleste værdier ligger, med værdierne aftagende i haleenderne.
i modsætning hertil er en skæv fordeling asymmetrisk og har flere værdier i den ene ende end den anden. Distributionens form er vigtig at huske på, fordi kun nogle beskrivende statistikker skal bruges med skæve distributioner.
ekstreme outliers kan også producere vildledende statistikker, så du kan få brug for en systematisk tilgang til at håndtere disse værdier.
Beregn mål for central tendens
mål for central tendens beskriv, hvor de fleste af værdierne i et datasæt ligger. Tre hovedmålinger af central tendens rapporteres ofte:
- Mode: det mest populære svar eller værdi i datasættet.
- Median: værdien i den nøjagtige midten af datasættet, når bestilt fra lav til høj.
- middel: summen af alle værdier divideret med antallet af værdier.
afhængigt af formen på fordelingen og måleniveauet kan kun en eller to af disse mål være passende. For eksempel kan mange demografiske egenskaber kun beskrives ved hjælp af tilstanden eller proportionerne, mens en variabel som reaktionstid muligvis slet ikke har en tilstand.
Beregn målinger af variabilitet
målinger af variabilitet fortæller dig, hvor spredt værdierne i et datasæt er. Fire hovedmål for variabilitet rapporteres ofte:
- område: den højeste værdi minus den laveste værdi af datasættet.
- Interkvartil rækkevidde: området for den midterste halvdel af datasættet.
- standardafvigelse: den gennemsnitlige afstand mellem hver værdi i dit datasæt og gennemsnittet.
- varians: kvadratet af standardafvigelsen.
endnu en gang skal formen på fordelingen og måleniveauet styre dit valg af variabilitetsstatistikker. Interkvartilområdet er det bedste mål for skæve fordelinger, mens standardafvigelse og varians giver den bedste information til normale fordelinger.
- eksperimentel
- korrelation
ved hjælp af din tabel skal du kontrollere, om enhederne i den beskrivende statistik er sammenlignelige for prætest-og posttest-score. Er variansniveauerne ens på tværs af grupperne? Er der nogen ekstreme værdier? Hvis der er, skal du muligvis identificere og fjerne ekstreme afvigelser i dit datasæt eller transformere dine data, før du udfører en statistisk test.
Pretest scores | Posttest scores | |
---|---|---|
middel | 68.44 | 75.25 |
standardafvigelse | 9.43 | 9.88 |
varians | 88.96 | 97.96 |
rækkevidde | 36.25 | 45.12 |
N | 30 |
fra denne tabel kan vi se, at den gennemsnitlige score steg efter meditationsøvelsen, og varianserne for de to scoringer er sammenlignelige. Dernæst kan vi udføre en statistisk test for at finde ud af, om denne forbedring i testresultater er statistisk signifikant i befolkningen.
det er vigtigt at kontrollere, om du har en bred vifte af datapunkter. Hvis du ikke gør det, kan dine data være skævt over for nogle grupper mere end andre (f.eks.
Forældreindkomst (USD) | GPA | |
---|---|---|
middel | 62,100 | 3.12 |
standardafvigelse | 15,000 | 0.45 |
varians | 225,000,000 | 0.16 |
rækkevidde | 8,000–378,000 | 2.64–4.00 |
N | 653 |
dernæst kan vi beregne en korrelationskoefficient og udføre en statistisk test for at forstå betydningen af forholdet mellem variablerne i befolkningen.
Trin 4: Test hypoteser eller lav estimater med inferentiel statistik
et tal, der beskriver en prøve, kaldes en statistik, mens et tal, der beskriver en population, kaldes en parameter. Ved hjælp af inferentiel statistik kan du drage konklusioner om befolkningsparametre baseret på stikprøvestatistikker.
forskere bruger ofte to hovedmetoder (samtidigt) til at drage konklusioner i statistikker.
- estimering: beregning af populationsparametre baseret på stikprøvestatistik.
- hypotesetest: en formel proces til test af forskningsprognoser om befolkningen ved hjælp af prøver.
estimering
du kan lave to typer estimater af populationsparametre fra stikprøvestatistik:
- et punktestimat: en værdi, der repræsenterer dit bedste gæt af den nøjagtige parameter.
- et intervalestimat: en række værdier, der repræsenterer dit bedste gæt på, hvor parameteren ligger.
hvis dit mål er at udlede og rapportere populationskarakteristika fra stikprøvedata, er det bedst at bruge både punkt-og intervalestimater i dit papir.
du kan betragte en stikprøvestatistik som et punktestimat for populationsparameteren, når du har en repræsentativ stikprøve (f.eks. i en bred meningsmåling tages andelen af en stikprøve, der understøtter den nuværende regering, som befolkningsandelen af regeringens tilhængere).
der er altid fejl involveret i estimering, så du bør også angive et konfidensinterval som et intervalestimat for at vise variabiliteten omkring et punktestimat.
et konfidensinterval bruger standardfejlen og å-scoren fra standard normalfordeling til at formidle, hvor du generelt forventer at finde populationsparameteren det meste af tiden.
hypotesetest
ved hjælp af data fra en prøve kan du teste hypoteser om forhold mellem variabler i befolkningen. Hypotesetestning starter med antagelsen om, at nulhypotesen er sand i befolkningen, og du bruger statistiske tests til at vurdere, om nulhypotesen kan afvises eller ej.
statistiske tests bestemmer, hvor dine prøvedata ville ligge på en forventet fordeling af prøvedata, hvis nulhypotesen var sand. Disse tests giver to hovedudgange:
- en teststatistik fortæller dig, hvor meget dine data adskiller sig fra testens nulhypotese.
- en p-værdi fortæller dig sandsynligheden for at opnå dine resultater, hvis nulhypotesen faktisk er sand i befolkningen.
statistiske tests kommer i tre hovedvarianter:
- sammenligningstest vurderer gruppeforskelle i resultater.
- regressionstest vurderer årsag-og-virkningsforhold mellem variabler.
- Korrelationstest vurderer forholdet mellem variabler uden at antage årsagssammenhæng.
dit valg af statistisk test afhænger af dine forskningsspørgsmål, forskningsdesign, prøveudtagningsmetode og datakarakteristika.
parametriske tests
parametriske tests gør kraftige slutninger om befolkningen baseret på prøvedata. Men for at bruge dem skal nogle antagelser være opfyldt, og kun nogle typer variabler kan bruges. Hvis dine data overtræder disse antagelser, kan du udføre passende datatransformationer eller bruge alternative ikke-parametriske tests i stedet.
en regressionsmodeller i hvilket omfang ændringer i en forudsigelsesvariabel resulterer i ændringer i udfaldsvariabler.
- en simpel lineær regression inkluderer en forudsigelsesvariabel og en resultatvariabel.
- en multipel lineær regression inkluderer to eller flere forudsigelsesvariabler og en resultatvariabel.
sammenligningstest sammenligner normalt gruppernes midler. Disse kan være midlerne til forskellige grupper inden for en prøve (f.eks. en behandlings-og kontrolgruppe), midlerne til en prøvegruppe taget på forskellige tidspunkter (f. eks.
- en T-test er for nøjagtigt 1 eller 2 grupper, når prøven er lille (30 eller mindre).
- en å-test er for nøjagtigt 1 eller 2 grupper, når prøven er stor.
- en ANOVA er for 3 eller flere grupper.
Å-og t-testene har undertyper baseret på antallet og typerne af prøver og hypoteserne:
- hvis du kun har en prøve, som du vil sammenligne med et populationsgennemsnit, skal du bruge en test med en prøve.
- hvis du har parrede målinger (inden-fag design), bruge en afhængig (parrede) prøver test.
- hvis du har helt separate målinger fra to uovertruffen grupper (mellem-fag design), bruge en uafhængig prøver test.
- hvis du forventer en forskel mellem grupper i en bestemt retning, skal du bruge en one-tailed test.
- hvis du ikke har nogen forventninger til retningen af en forskel mellem grupper, skal du bruge en to-tailed test.
den eneste parametriske korrelationstest er Pearsons r. korrelationskoefficienten (r) fortæller dig styrken af et lineært forhold mellem to kvantitative variabler.
for at teste, om korrelationen i prøven er stærk nok til at være vigtig i befolkningen, skal du også udføre en signifikanstest af korrelationskoefficienten, normalt en t-test, for at opnå en p-værdi. Denne test bruger din stikprøvestørrelse til at beregne, hvor meget korrelationskoefficienten adskiller sig fra nul i befolkningen.
- eksperimentel
- korrelation
Trin 5: Fortolk dine resultater
det sidste trin i statistisk analyse er at fortolke dine resultater.
statistisk signifikans
i hypotesetestning er statistisk signifikans de vigtigste kriterier for dannelse af konklusioner. Du sammenligner din p-værdi med et sæt signifikansniveau (normalt 0,05) for at afgøre, om dine resultater er statistisk signifikante eller ikke-signifikante.
statistisk signifikante resultater anses for usandsynligt at være opstået udelukkende på grund af tilfældigheder. Der er kun en meget lav chance for, at et sådant resultat opstår, hvis nulhypotesen er sand i befolkningen.
- eksperimentel
- korrelation
effekt størrelse
en statistisk signifikant resultat betyder ikke nødvendigvis, at der er vigtige virkelige liv applikationer eller kliniske resultater for en konstatering.
i modsætning hertil angiver effektstørrelsen den praktiske betydning af dine resultater. Det er vigtigt at rapportere effektstørrelser sammen med dine inferentielle statistikker for at få et komplet billede af dine resultater. Du bør også rapportere interval estimater af effektstørrelser, hvis du skriver en APA stil papir.
- eksperimentel
- korrelation
Beslutningsfejl
type I-og type II-fejl er fejl, der er begået i forskningskonklusioner. En type i-fejl betyder at afvise nulhypotesen, når den faktisk er sand, mens en type II-fejl betyder ikke at afvise nulhypotesen, når den er falsk.
du kan sigte mod at minimere risikoen for disse fejl ved at vælge et optimalt signifikansniveau og sikre høj effekt. Der er dog en afvejning mellem de to fejl, så en fin balance er nødvendig.
frekvens versus Bayesian statistik
traditionelt lægger frekvensstatistik vægt på nulhypotese signifikanstest og starter altid med antagelsen om en sand nulhypotese.
Bayesian statistik er dog vokset i popularitet som en alternativ tilgang i de sidste par årtier. I denne tilgang bruger du tidligere forskning til løbende at opdatere dine hypoteser baseret på dine forventninger og observationer.
Bayes factor sammenligner den relative styrke af bevis for nul versus den alternative hypotese snarere end at konkludere om at afvise nulhypotesen eller ej.
ofte stillede spørgsmål om statistisk analyse
statistisk analyse er den vigtigste metode til analyse af kvantitative forskningsdata. Det bruger sandsynligheder og modeller til at teste forudsigelser om en population fra stikprøvedata.
Beskrivende statistik opsummerer karakteristika for et datasæt. Inferentiel statistik giver dig mulighed for at teste en hypotese eller vurdere, om dine data kan generaliseres til den bredere befolkning.
hypotesetestning er en formel procedure til undersøgelse af vores ideer om verden ved hjælp af statistikker. Det bruges af forskere til at teste specifikke forudsigelser, kaldet hypoteser, ved at beregne, hvor sandsynligt det er, at et mønster eller forhold mellem variabler kunne være opstået ved en tilfældighed.
i statistisk hypotesetest forudsiger nulhypotesen for en test altid ingen effekt eller intet forhold mellem variabler, mens den alternative hypotese angiver din forskningsforudsigelse af en effekt eller et forhold.
statistisk signifikans er et udtryk, som forskere bruger til at sige, at det er usandsynligt, at deres observationer kunne have fundet sted under nulhypotesen af en statistisk test. Betydning er normalt betegnet med en p-værdi eller sandsynlighedsværdi.
statistisk signifikans er vilkårlig – det afhænger af tærsklen eller alfa-værdien valgt af forskeren. Den mest almindelige tærskel er p < 0,05, hvilket betyder, at dataene sandsynligvis vil forekomme mindre end 5% af tiden under nulhypotesen.
når p-værdien falder under den valgte alfa-værdi, siger vi, at resultatet af testen er statistisk signifikant.