Analisi statistica significa indagare tendenze, modelli e relazioni utilizzando dati quantitativi. È un importante strumento di ricerca utilizzato da scienziati, governi, aziende e altre organizzazioni.

Per trarre conclusioni valide, l’analisi statistica richiede un’attenta pianificazione fin dall’inizio del processo di ricerca. È necessario specificare le ipotesi e prendere decisioni sulla progettazione della ricerca, sulla dimensione del campione e sulla procedura di campionamento.

Dopo aver raccolto i dati dal campione, è possibile organizzare e riassumere i dati utilizzando statistiche descrittive. Quindi, è possibile utilizzare le statistiche inferenziali per testare formalmente le ipotesi e fare stime sulla popolazione. Infine, puoi interpretare e generalizzare i tuoi risultati.

Questo articolo è un’introduzione pratica all’analisi statistica per studenti e ricercatori. Ti guideremo attraverso i passaggi utilizzando due esempi di ricerca. Il primo indaga una potenziale relazione causa-effetto, mentre il secondo indaga una potenziale correlazione tra variabili.

Esempio: Domanda di ricerca causale
La meditazione può migliorare le prestazioni degli esami negli adolescenti?
Esempio: Domanda di ricerca correlazionale
Esiste una relazione tra reddito parentale e media dei punti di grado universitario (GPA)?

Passo 1: Scrivi le tue ipotesi e pianifica il tuo progetto di ricerca

Per raccogliere dati validi per l’analisi statistica, devi prima specificare le tue ipotesi e pianificare il tuo progetto di ricerca.

Scrivere ipotesi statistiche

L’obiettivo della ricerca è spesso quello di indagare una relazione tra variabili all’interno di una popolazione. Si inizia con una previsione e si utilizza l’analisi statistica per testare tale previsione.

Un’ipotesi statistica è un modo formale di scrivere una previsione su una popolazione. Ogni previsione di ricerca viene riformulata in ipotesi nulle e alternative che possono essere testate utilizzando dati di esempio.

Mentre l’ipotesi nulla prevede sempre nessun effetto o nessuna relazione tra le variabili, l’ipotesi alternativa afferma la previsione di ricerca di un effetto o di una relazione.

Esempio: Ipotesi statistiche per testare un effetto
  • Ipotesi nulla: un esercizio di meditazione di 5 minuti non avrà alcun effetto sui punteggi dei test di matematica negli adolescenti.
  • Ipotesi alternativa: un esercizio di meditazione di 5 minuti migliorerà i punteggi dei test di matematica negli adolescenti.
Esempio: Ipotesi statistiche per testare una correlazione
  • Ipotesi nulla: reddito parentale e GPA non hanno alcuna relazione tra loro negli studenti universitari.
  • Ipotesi alternativa: reddito parentale e GPA sono positivamente correlati negli studenti universitari.

Pianificazione del progetto di ricerca

Un progetto di ricerca è la strategia complessiva per la raccolta e l’analisi dei dati. Determina i test statistici che puoi utilizzare per testare la tua ipotesi in seguito.

Innanzitutto, decidi se la tua ricerca utilizzerà un design descrittivo, correlazionale o sperimentale. Gli esperimenti influenzano direttamente le variabili, mentre gli studi descrittivi e correlazionali misurano solo le variabili.

  • In un progetto sperimentale, è possibile valutare una relazione causa-effetto (ad esempio, l’effetto della meditazione sui punteggi dei test) utilizzando test statistici di confronto o regressione.
  • In un progetto correlazionale, è possibile esplorare le relazioni tra variabili (ad esempio, reddito parentale e GPA) senza alcuna assunzione di causalità usando coefficienti di correlazione e test di significatività.
  • In un design descrittivo, è possibile studiare le caratteristiche di una popolazione o di un fenomeno (ad esempio, la prevalenza dell’ansia negli studenti universitari statunitensi) utilizzando test statistici per trarre inferenze da dati campione.

Il tuo progetto di ricerca riguarda anche se confronterai i partecipanti a livello di gruppo o individuale, o entrambi.

  • In un progetto tra soggetti, si confrontano i risultati a livello di gruppo dei partecipanti che sono stati esposti a trattamenti diversi (ad esempio, quelli che hanno eseguito un esercizio di meditazione rispetto a quelli che non l’hanno fatto).
  • In un design all’interno dei soggetti, si confrontano le misure ripetute dei partecipanti che hanno partecipato a tutti i trattamenti di uno studio (ad esempio, i punteggi di prima e dopo l’esecuzione di un esercizio di meditazione).
  • Sperimentale
  • Correlazionale
Esempio: Experimental research design
Si progetta un esperimento all’interno di soggetti per studiare se un esercizio di meditazione di 5 minuti può migliorare i punteggi dei test di matematica. Il tuo studio prende misure ripetute da un gruppo di partecipanti.

In primo luogo, prenderai i punteggi dei test di base dai partecipanti. Quindi, i partecipanti saranno sottoposti a un esercizio di meditazione di 5 minuti. Infine, potrai registrare i punteggi dei partecipanti da un secondo test di matematica.

In questo esperimento, la variabile indipendente è l’esercizio di meditazione di 5 minuti e la variabile dipendente è la variazione dei punteggi dei test di matematica da prima e dopo l’intervento.

Esempio: Correlational research design
In uno studio correlazionale, si verifica se esiste una relazione tra reddito parentale e GPA nella laurea degli studenti universitari. Per raccogliere i tuoi dati, chiederai ai partecipanti di compilare un sondaggio e di auto-riferire i redditi dei loro genitori e il proprio GPA.

Non ci sono variabili dipendenti o indipendenti in questo studio, perché si desidera solo misurare le variabili senza influenzarle in alcun modo.

Misurazione delle variabili

Quando si pianifica un progetto di ricerca, è necessario rendere operative le variabili e decidere esattamente come misurarle.

Per l’analisi statistica, è importante considerare il livello di misurazione delle variabili, che indica il tipo di dati che contengono:

  • I dati categoriali rappresentano i raggruppamenti. Questi possono essere nominali (ad es., genere) o ordinale (ad esempio livello di abilità linguistica).
  • I dati quantitativi rappresentano gli importi. Questi possono essere su una scala di intervallo (ad esempio punteggio del test) o una scala di rapporto (ad esempio età).

Molte variabili possono essere misurate a diversi livelli di precisione. Ad esempio, i dati sull’età possono essere quantitativi (8 anni) o categoriali (giovani). Se una variabile è codificata numericamente (ad esempio, livello di accordo da 1-5), non significa automaticamente che sia quantitativa anziché categorica.

Identificare il livello di misurazione è importante per la scelta di statistiche appropriate e test di ipotesi. Ad esempio, è possibile calcolare un punteggio medio con dati quantitativi, ma non con dati categoriali.

In uno studio di ricerca, insieme alle misure delle variabili di interesse, raccoglierai spesso dati sulle caratteristiche rilevanti dei partecipanti.

  • Sperimentale
  • Correlazionale
Esempio: Variabili (esperimento)
È possibile eseguire molti calcoli con dati quantitativi di età o punteggio del test, mentre le variabili categoriali possono essere utilizzate per decidere i raggruppamenti per i test di confronto.

Variabile Tipo di dati
Età Quantitativi (rapporto)
Genere Categorico (nominale)
la Razza o l’etnia Categorico (nominale)
test di riferimento punteggi Quantitativi (intervallo)
Finale i punteggi dei test Quantitativi (intervallo)
Esempio: Variabili (studio correlazionale)
I tipi di variabili in uno studio correlazionale determinano il test che verrà utilizzato per un coefficiente di correlazione. Un test di correlazione parametrica può essere utilizzato per i dati quantitativi, mentre un test di correlazione non parametrica dovrebbe essere utilizzato se una delle variabili è ordinale.

Variabile Tipo di dati
il reddito dei Genitori Quantitativi (rapporto)
GPA Quantitativi (intervallo)

Passo 2: Raccogliere dati da un campione

Popolazione vs campione

Popolazione vs campione

Nella maggior parte dei casi, è troppo difficile o costoso raccogliere dati da ogni membro della popolazione che ti interessa studiare. Invece, raccoglierai dati da un campione.

L’analisi statistica consente di applicare i risultati oltre il proprio campione, purché si utilizzino procedure di campionamento appropriate. Dovresti mirare a un campione rappresentativo della popolazione.

Campionamento per analisi statistica

Esistono due approcci principali per selezionare un campione.

  • Campionamento probabilistico: ogni membro della popolazione ha la possibilità di essere selezionato per lo studio attraverso la selezione casuale.
  • Campionamento non probabilistico: alcuni membri della popolazione hanno più probabilità di altri di essere selezionati per lo studio a causa di criteri come la convenienza o l’auto-selezione volontaria.

In teoria, per risultati altamente generalizzabili, è necessario utilizzare un metodo di campionamento probabilistico. La selezione casuale riduce il bias di campionamento e garantisce che i dati del campione siano effettivamente tipici della popolazione. I test parametrici possono essere utilizzati per effettuare forti inferenze statistiche quando i dati vengono raccolti utilizzando il campionamento di probabilità.

Ma in pratica, raramente è possibile raccogliere il campione ideale. Mentre i campioni non probabilistici hanno maggiori probabilità di essere prevenuti, sono molto più facili da reclutare e raccogliere dati. I test non parametrici sono più appropriati per i campioni non probabilistici, ma si traducono in inferenze più deboli sulla popolazione.

Se si desidera utilizzare test parametrici per campioni non probabilistici, è necessario fare in modo che:

  • il tuo campione è rappresentativo della popolazione a cui stai generalizzando i tuoi risultati.
  • il tuo campione manca di pregiudizi sistematici.

Tieni presente che la validità esterna significa che puoi generalizzare le tue conclusioni solo ad altri che condividono le caratteristiche del tuo campione. Ad esempio, i risultati di campioni occidentali, istruiti, industrializzati, ricchi e democratici (ad es., gli studenti universitari negli Stati Uniti) non sono automaticamente applicabili a tutte le popolazioni non STRANE.

Se si applicano test parametrici a dati provenienti da campioni non probabilistici, assicurarsi di approfondire i limiti di quanto i risultati possono essere generalizzati nella sezione di discussione.

Crea una procedura di campionamento appropriata

In base alle risorse disponibili per la tua ricerca, decidi come reclutare i partecipanti.

  • Avrai risorse per pubblicizzare ampiamente il tuo studio, anche al di fuori del tuo ambiente universitario?
  • Avrai i mezzi per reclutare un campione diversificato che rappresenti un’ampia popolazione?
  • Hai tempo per contattare e seguire i membri di gruppi difficili da raggiungere?

  • Sperimentale
  • Correlazionale
Esempio: Campionamento (esperimento)
La popolazione che ti interessa sono gli studenti delle scuole superiori della tua città. Contatta tre scuole private e sette scuole pubbliche in vari quartieri della città per vedere se puoi amministrare il tuo esperimento agli studenti dell ‘ 11 ° grado.

I partecipanti sono auto-selezionati dalle loro scuole. Sebbene tu stia utilizzando un campione non probabilistico, miri a un campione diverso e rappresentativo.

Esempio: Campionamento (studio correlazionale)
La tua popolazione principale di interesse è studenti universitari maschi negli Stati Uniti. Usando la pubblicità sui social media, recluti studenti universitari maschi dell’ultimo anno da una sottopopolazione più piccola: sette università nella zona di Boston.

I partecipanti si offrono volontari per il sondaggio, rendendo questo un campione non probabilistico.

Calcola la dimensione del campione sufficiente

Prima di reclutare i partecipanti, decidi la dimensione del campione esaminando altri studi nel tuo campo o utilizzando le statistiche. Un campione troppo piccolo potrebbe non essere rappresentativo del campione, mentre un campione troppo grande sarà più costoso del necessario.

Ci sono molti calcolatori di dimensioni del campione online. Vengono utilizzate formule diverse a seconda che tu abbia sottogruppi o quanto debba essere rigoroso il tuo studio (ad esempio, nella ricerca clinica). Come regola generale, è necessario un minimo di 30 unità o più per sottogruppo.

Per utilizzare questi calcolatori, è necessario comprendere e inserire questi componenti chiave:

  • Livello di significatività (alfa): il rischio di rifiutare una vera ipotesi nulla che si è disposti a prendere, di solito fissato al 5%.
  • Potenza statistica: la probabilità che il tuo studio rilevi un effetto di una certa dimensione se ce n’è uno, di solito dell ‘ 80% o superiore.
  • Dimensione effetto previsto: un’indicazione standardizzata di quanto grande sarà il risultato atteso del tuo studio, di solito basato su altri studi simili.
  • Deviazione standard della popolazione: stima del parametro della popolazione sulla base di uno studio precedente o di uno studio pilota.

Qual è il tuo punteggio di plagio?

Confronta la tua carta con oltre 60 miliardi di pagine web e 30 milioni di pubblicazioni.

  • Migliori plagiarism checker 2021
  • Plagio report & percentuale
  • più Grande plagio database

Scribbr Plagiarism Checker

Passo 3: Riassumere i dati con le statistiche descrittive

una Volta raccolti tutti i dati, è possibile ispezionare e calcolare le statistiche descrittive che riassumere.

Ispeziona i tuoi dati

Esistono vari modi per ispezionare i tuoi dati, tra cui i seguenti:

  • Organizzazione dei dati da ciascuna variabile nelle tabelle di distribuzione della frequenza.
  • Visualizzazione dei dati da una variabile chiave in un grafico a barre per visualizzare la distribuzione delle risposte.
  • Visualizzazione della relazione tra due variabili utilizzando un grafico a dispersione.

Visualizzando i dati in tabelle e grafici, è possibile valutare se i dati seguono una distribuzione distorta o normale e se ci sono valori anomali o dati mancanti.

Una distribuzione normale significa che i dati sono distribuiti simmetricamente attorno a un centro in cui si trovano la maggior parte dei valori, con i valori che si assottigliano alle estremità della coda.

Media, mediana, modo e deviazione standard in una distribuzione normale

Media, mediana, modalità e deviazione standard in una distribuzione normale

Al contrario, una distribuzione inclinata è asimmetrica e ha più valori su un’estremità rispetto all’altra. La forma della distribuzione è importante da tenere a mente perché solo alcune statistiche descrittive dovrebbero essere utilizzate con distribuzioni distorte.

I valori anomali estremi possono anche produrre statistiche fuorvianti, quindi potrebbe essere necessario un approccio sistematico per gestire questi valori.

Calcola le misure di tendenza centrale

Le misure di tendenza centrale descrivono dove si trovano la maggior parte dei valori in un set di dati. Tre misure principali di tendenza centrale sono spesso riportate:

  • Modalità: la risposta o il valore più popolare nel set di dati.
  • Mediana: il valore nel mezzo esatto del set di dati quando ordinato dal basso verso l’alto.
  • Media: la somma di tutti i valori divisa per il numero di valori.

Tuttavia, a seconda della forma della distribuzione e del livello di misurazione, solo una o due di queste misure possono essere appropriate. Ad esempio, molte caratteristiche demografiche possono essere descritte solo utilizzando la modalità o le proporzioni, mentre una variabile come il tempo di reazione potrebbe non avere affatto una modalità.

Calcola le misure di variabilità

Le misure di variabilità indicano la distribuzione dei valori in un set di dati. Sono spesso riportate quattro principali misure di variabilità:

  • Intervallo: il valore più alto meno il valore più basso del set di dati.
  • Intervallo interquartile: intervallo della metà centrale del set di dati.
  • Deviazione standard: la distanza media tra ciascun valore nel set di dati e la media.
  • Varianza: il quadrato della deviazione standard.

Ancora una volta, la forma della distribuzione e il livello di misurazione dovrebbero guidare la scelta delle statistiche di variabilità. L’intervallo interquartile è la misura migliore per le distribuzioni distorte, mentre la deviazione standard e la varianza forniscono le migliori informazioni per le distribuzioni normali.

  • Sperimentale
  • Correlazionale
Esempio: Statistiche descrittive (esperimento)
Dopo aver raccolto i dati pre-test e post-test da 30 studenti in tutta la città, si calcolano le statistiche descrittive. Poiché si dispone di dati distribuiti normali su una scala di intervalli, si tabulano la media, la deviazione standard, la varianza e l’intervallo.

Utilizzando la tabella, è necessario verificare se le unità delle statistiche descrittive sono comparabili per i punteggi pre-test e post-test. Ad esempio, i livelli di varianza sono simili tra i gruppi? Ci sono valori estremi? Se ci sono, potrebbe essere necessario identificare e rimuovere valori anomali estremi nel set di dati o trasformare i dati prima di eseguire un test statistico.

Pre-test punteggi post-test i punteggi
Media 68.44 75.25
deviazione Standard 9.43 9.88
Varianza 88.96 97.96
Gamma 36.25 45.12
N 30

Da questa tabella si può vedere che la media di punteggio è aumentato dopo l’esercizio di meditazione, e le varianze dei due punteggi sono paragonabili. Successivamente, possiamo eseguire un test statistico per scoprire se questo miglioramento nei punteggi dei test è statisticamente significativo nella popolazione.

Esempio: Statistiche descrittive (correlational study)
Dopo aver raccolto i dati da 653 studenti, si tabulano le statistiche descrittive per il reddito annuale dei genitori e GPA.

È importante verificare se si dispone di una vasta gamma di punti dati. Se non lo fai, i tuoi dati potrebbero essere distorti verso alcuni gruppi più di altri (ad esempio, alti achievers accademici), e solo inferenze limitate possono essere fatte su una relazione.

Reddito parentale (USD) GPA
Media 62,100 3.12
deviazione Standard 15,000 0.45
Varianza 225,000,000 0.16
Gamma 8,000–378,000 2.64–4.00
N 653

a quel punto, siamo in grado di calcolare un coefficiente di correlazione e di eseguire un test statistico per comprendere il significato della relazione tra le variabili nella popolazione.

Punto 4: Verifica ipotesi o effettua stime con statistiche inferenziali

Un numero che descrive un campione è chiamato statistica, mentre un numero che descrive una popolazione è chiamato parametro. Utilizzando le statistiche inferenziali, è possibile trarre conclusioni sui parametri della popolazione in base alle statistiche di esempio.

I ricercatori usano spesso due metodi principali (simultaneamente) per fare inferenze nelle statistiche.

  • Stima: calcolo dei parametri di popolazione basati su statistiche campione.
  • Test di ipotesi: un processo formale per testare le previsioni di ricerca sulla popolazione utilizzando campioni.

Stima

È possibile effettuare due tipi di stime dei parametri di popolazione dalle statistiche di esempio:

  • Una stima puntuale: un valore che rappresenta la migliore ipotesi del parametro esatto.
  • Una stima dell’intervallo: un intervallo di valori che rappresentano la migliore ipotesi su dove si trova il parametro.

Se il tuo obiettivo è quello di dedurre e riportare le caratteristiche della popolazione dai dati di esempio, è meglio utilizzare sia le stime puntuali che quelle intervallate nel tuo documento.

È possibile considerare una statistica campione una stima puntuale per il parametro della popolazione quando si dispone di un campione rappresentativo (ad esempio, in un ampio sondaggio di opinione pubblica, la percentuale di un campione che supporta il governo corrente viene presa come la percentuale di popolazione dei sostenitori del governo).

C’è sempre un errore nella stima, quindi dovresti anche fornire un intervallo di confidenza come stima dell’intervallo per mostrare la variabilità attorno a una stima puntuale.

Un intervallo di confidenza utilizza l’errore standard e il punteggio z della distribuzione normale standard per trasmettere dove generalmente ci si aspetta di trovare il parametro di popolazione la maggior parte del tempo.

Test di ipotesi

Utilizzando i dati di un campione, è possibile testare ipotesi sulle relazioni tra variabili nella popolazione. Il test di ipotesi inizia con l’ipotesi che l’ipotesi nulla sia vera nella popolazione e si utilizzano test statistici per valutare se l’ipotesi nulla può essere respinta o meno.

I test statistici determinano dove si troverebbero i dati di esempio su una distribuzione prevista di dati di esempio se l’ipotesi nulla fosse vera. Questi test forniscono due risultati principali:

  • Una statistica di test ti dice quanto i tuoi dati differiscono dall’ipotesi nulla del test.
  • Un valore p indica la probabilità di ottenere i risultati se l’ipotesi nulla è effettivamente vera nella popolazione.

I test statistici sono disponibili in tre varietà principali:

  • I test di confronto valutano le differenze di gruppo nei risultati.
  • I test di regressione valutano le relazioni causa-effetto tra le variabili.
  • I test di correlazione valutano le relazioni tra le variabili senza assumere la causalità.

La scelta del test statistico dipende dalle domande di ricerca, dal design della ricerca, dal metodo di campionamento e dalle caratteristiche dei dati.

Test parametrici

I test parametrici fanno potenti inferenze sulla popolazione basate su dati campione. Ma per usarli, alcune ipotesi devono essere soddisfatte e solo alcuni tipi di variabili possono essere utilizzati. Se i dati violano queste ipotesi, è possibile eseguire trasformazioni di dati appropriate o utilizzare test alternativi non parametrici.

Una regressione modella la misura in cui i cambiamenti in una variabile predittiva determinano cambiamenti nelle variabili di risultato.

  • Una regressione lineare semplice include una variabile predittiva e una variabile di risultato.
  • Una regressione lineare multipla include due o più variabili predittive e una variabile di risultato.

I test di confronto di solito confrontano i mezzi dei gruppi. Questi possono essere i mezzi di diversi gruppi all’interno di un campione (ad esempio, un gruppo di trattamento e di controllo), i mezzi di un gruppo di campioni prelevati in momenti diversi (ad esempio, i punteggi pre-test e post-test), o una media del campione e una media della popolazione.

  • Un test t è per esattamente 1 o 2 gruppi quando il campione è piccolo (30 o meno).
  • Un test z è per esattamente 1 o 2 gruppi quando il campione è grande.
  • Un ANOVA è per 3 o più gruppi.

I test z e t hanno sottotipi in base al numero e ai tipi di campioni e alle ipotesi:

  • Se si dispone di un solo campione che si desidera confrontare con una media di popolazione, utilizzare un test di un campione.
  • Se si dispone di misurazioni accoppiate (design all’interno dei soggetti), utilizzare un test di campioni dipendenti (accoppiati).
  • Se si dispone di misurazioni completamente separate da due gruppi non corrispondenti (progettazione tra soggetti), utilizzare un test di campioni indipendenti.
  • Se si prevede una differenza tra i gruppi in una direzione specifica, utilizzare un test a coda singola.
  • Se non hai aspettative sulla direzione di una differenza tra i gruppi, usa un test a due code.

L’unico test di correlazione parametrica è r di Pearson. Il coefficiente di correlazione (r) indica la forza di una relazione lineare tra due variabili quantitative.

Tuttavia, per verificare se la correlazione nel campione è abbastanza forte da essere importante nella popolazione, è anche necessario eseguire un test di significatività del coefficiente di correlazione, di solito un test t, per ottenere un valore p. Questo test utilizza la dimensione del campione per calcolare quanto il coefficiente di correlazione differisce da zero nella popolazione.

  • Sperimentale
  • Correlazionale
Esempio: Test t accoppiato per la ricerca sperimentale
Poiché il tuo progetto di ricerca è un esperimento all’interno di soggetti, sia le misurazioni pre-test che quelle post-test provengono dallo stesso gruppo, quindi è necessario un test t dipendente (accoppiato). Poiché si prevede un cambiamento in una direzione specifica (un miglioramento dei punteggi dei test), è necessario un test a coda singola.

Si utilizza un dipendente-campioni, one-tailed t test per valutare se l’esercizio di meditazione significativamente migliorato i punteggi dei test di matematica. Il test ti dà:

  • un valore di t (statistica della prova) di 3,00
  • un valore di p di 0.0028
Esempio: Coefficiente di correlazione e test di significatività
Si utilizza r di Pearson per calcolare la forza della relazione lineare tra reddito parentale e GPA nel campione. Il valore r di Pearson è 0.12, indicando una piccola correlazione nel campione.

Sebbene la r di Pearson sia una statistica di test, non ti dice nulla su quanto sia significativa la correlazione nella popolazione. È inoltre necessario verificare se questo coefficiente di correlazione del campione è abbastanza grande da dimostrare una correlazione nella popolazione.

Un test t può anche determinare quanto significativamente un coefficiente di correlazione differisce da zero in base alla dimensione del campione. Dal momento che ci si aspetta una correlazione positiva tra reddito parentale e GPA, si utilizza un test t a una coda di un campione. Il test t ti dà:

  • un valore t di 3,08
  • un valore p di 0.001

Punto 5: Interpretare i risultati

La fase finale dell’analisi statistica è interpretare i risultati.

Significatività statistica

Nel test di ipotesi, la significatività statistica è il criterio principale per formare conclusioni. Si confronta il valore p con un livello di significatività impostato (di solito 0,05) per decidere se i risultati sono statisticamente significativi o non significativi.

I risultati statisticamente significativi sono considerati improbabili solo a causa del caso. C’è solo una probabilità molto bassa che un tale risultato si verifichi se l’ipotesi nulla è vera nella popolazione.

  • Sperimentale
  • Correlazionale
Esempio: Interpretare i risultati (esperimento)
Si confronta il valore p di 0,0027 con la soglia di significatività di 0,05. Poiché il valore p è inferiore, si decide di rifiutare l’ipotesi nulla e si considerano i risultati statisticamente significativi.

Ciò significa che credi che l’intervento di meditazione, piuttosto che fattori casuali, abbia causato direttamente l’aumento dei punteggi dei test.

Esempio: Interpretare i risultati (studio correlazionale)
Si confronta il valore p di 0,001 con la soglia di significatività di 0,05. Con un valore p sotto questa soglia, è possibile rifiutare l’ipotesi nulla. Ciò indica una correlazione statisticamente significativa tra reddito parentale e GPA negli studenti universitari maschi.

Si noti che la correlazione non significa sempre causalità, perché spesso ci sono molti fattori sottostanti che contribuiscono a una variabile complessa come GPA. Anche se una variabile è correlata a un’altra, ciò può essere dovuto a una terza variabile che influenza entrambe o collegamenti indiretti tra le due variabili.

Una grande dimensione del campione può anche influenzare fortemente la significatività statistica di un coefficiente di correlazione facendo sembrare significativi coefficienti di correlazione molto piccoli.

Dimensione effetto

Un risultato statisticamente significativo non significa necessariamente che ci sono importanti applicazioni di vita reale o risultati clinici per una constatazione.

Al contrario, la dimensione dell’effetto indica il significato pratico dei risultati. È importante segnalare le dimensioni degli effetti insieme alle statistiche inferenziali per un quadro completo dei risultati. Dovresti anche segnalare le stime dell’intervallo delle dimensioni degli effetti se stai scrivendo un documento in stile APA.

  • Sperimentale
  • Correlazionale
Esempio: Dimensione dell’effetto (esperimento)
Si calcola la d di Cohen per trovare la dimensione della differenza tra i punteggi pre-test e post-test.

Con la d di Cohen di 0.72, c’è un significato pratico medio-alto per la tua scoperta che l’esercizio di meditazione ha migliorato i punteggi dei test.

Esempio: Dimensione dell’effetto (studio correlazionale)
Per determinare la dimensione dell’effetto del coefficiente di correlazione, si confronta il valore r di Pearson con i criteri di dimensione dell’effetto di Cohen.

Poiché il valore è compreso tra 0,1 e 0,3, la ricerca di una relazione tra reddito parentale e GPA rappresenta un effetto molto piccolo e ha un significato pratico limitato.

Errori decisionali

Gli errori di tipo I e di tipo II sono errori commessi nelle conclusioni della ricerca. Un errore di tipo I significa rifiutare l’ipotesi nulla quando è effettivamente vero, mentre un errore di tipo II significa non riuscire a rifiutare l’ipotesi nulla quando è falsa.

È possibile mirare a ridurre al minimo il rischio di questi errori selezionando un livello di significatività ottimale e garantendo un’elevata potenza. Tuttavia, c’è un compromesso tra i due errori, quindi è necessario un buon equilibrio.

Statistica frequentista contro statistica bayesiana

Tradizionalmente, la statistica frequentista enfatizza il test del significato dell’ipotesi nulla e inizia sempre con l’assunzione di una vera ipotesi nulla.

Tuttavia, le statistiche bayesiane sono cresciute in popolarità come approccio alternativo negli ultimi decenni. In questo approccio, usi ricerche precedenti per aggiornare continuamente le tue ipotesi in base alle tue aspettative e osservazioni.

Il fattore di Bayes confronta la forza relativa dell’evidenza per il nullo rispetto all’ipotesi alternativa piuttosto che fare una conclusione sul rifiuto o meno dell’ipotesi nulla.

Domande frequenti sull’analisi statistica

Che cos’è l’analisi statistica?

L’analisi statistica è il metodo principale per analizzare i dati di ricerca quantitativa. Utilizza probabilità e modelli per testare le previsioni su una popolazione da dati di esempio.

Qual è la differenza tra statistiche descrittive e inferenziali?

Le statistiche descrittive riassumono le caratteristiche di un set di dati. Le statistiche inferenziali consentono di testare un’ipotesi o valutare se i dati sono generalizzabili per la popolazione più ampia.

Che cos’è il test di ipotesi?

Il test di ipotesi è una procedura formale per indagare le nostre idee sul mondo usando le statistiche. Viene utilizzato dagli scienziati per testare previsioni specifiche, chiamate ipotesi, calcolando quanto è probabile che un modello o una relazione tra variabili possa essere sorto per caso.

Quali sono le ipotesi nulle e alternative?

Nel test di ipotesi statistica, l’ipotesi nulla di un test prevede sempre alcun effetto o nessuna relazione tra variabili, mentre l’ipotesi alternativa afferma la previsione di ricerca di un effetto o di una relazione.

Qual è la significatività statistica?

La significatività statistica è un termine usato dai ricercatori per affermare che è improbabile che le loro osservazioni possano essersi verificate sotto l’ipotesi nulla di un test statistico. Il significato è solitamente indicato da un valore p o valore di probabilità.

La significatività statistica è arbitraria – dipende dalla soglia, o dal valore alfa, scelto dal ricercatore. La soglia più comune è p < 0,05, il che significa che è probabile che i dati si verifichino meno del 5% delle volte sotto l’ipotesi nulla.

Quando il valore p scende al di sotto del valore alfa scelto, diciamo che il risultato del test è statisticamente significativo.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.