Analisi statistica significa indagare tendenze, modelli e relazioni utilizzando dati quantitativi. È un importante strumento di ricerca utilizzato da scienziati, governi, aziende e altre organizzazioni.
Per trarre conclusioni valide, l’analisi statistica richiede un’attenta pianificazione fin dall’inizio del processo di ricerca. È necessario specificare le ipotesi e prendere decisioni sulla progettazione della ricerca, sulla dimensione del campione e sulla procedura di campionamento.
Dopo aver raccolto i dati dal campione, è possibile organizzare e riassumere i dati utilizzando statistiche descrittive. Quindi, è possibile utilizzare le statistiche inferenziali per testare formalmente le ipotesi e fare stime sulla popolazione. Infine, puoi interpretare e generalizzare i tuoi risultati.
Questo articolo è un’introduzione pratica all’analisi statistica per studenti e ricercatori. Ti guideremo attraverso i passaggi utilizzando due esempi di ricerca. Il primo indaga una potenziale relazione causa-effetto, mentre il secondo indaga una potenziale correlazione tra variabili.
Passo 1: Scrivi le tue ipotesi e pianifica il tuo progetto di ricerca
Per raccogliere dati validi per l’analisi statistica, devi prima specificare le tue ipotesi e pianificare il tuo progetto di ricerca.
Scrivere ipotesi statistiche
L’obiettivo della ricerca è spesso quello di indagare una relazione tra variabili all’interno di una popolazione. Si inizia con una previsione e si utilizza l’analisi statistica per testare tale previsione.
Un’ipotesi statistica è un modo formale di scrivere una previsione su una popolazione. Ogni previsione di ricerca viene riformulata in ipotesi nulle e alternative che possono essere testate utilizzando dati di esempio.
Mentre l’ipotesi nulla prevede sempre nessun effetto o nessuna relazione tra le variabili, l’ipotesi alternativa afferma la previsione di ricerca di un effetto o di una relazione.
Pianificazione del progetto di ricerca
Un progetto di ricerca è la strategia complessiva per la raccolta e l’analisi dei dati. Determina i test statistici che puoi utilizzare per testare la tua ipotesi in seguito.
Innanzitutto, decidi se la tua ricerca utilizzerà un design descrittivo, correlazionale o sperimentale. Gli esperimenti influenzano direttamente le variabili, mentre gli studi descrittivi e correlazionali misurano solo le variabili.
- In un progetto sperimentale, è possibile valutare una relazione causa-effetto (ad esempio, l’effetto della meditazione sui punteggi dei test) utilizzando test statistici di confronto o regressione.
- In un progetto correlazionale, è possibile esplorare le relazioni tra variabili (ad esempio, reddito parentale e GPA) senza alcuna assunzione di causalità usando coefficienti di correlazione e test di significatività.
- In un design descrittivo, è possibile studiare le caratteristiche di una popolazione o di un fenomeno (ad esempio, la prevalenza dell’ansia negli studenti universitari statunitensi) utilizzando test statistici per trarre inferenze da dati campione.
Il tuo progetto di ricerca riguarda anche se confronterai i partecipanti a livello di gruppo o individuale, o entrambi.
- In un progetto tra soggetti, si confrontano i risultati a livello di gruppo dei partecipanti che sono stati esposti a trattamenti diversi (ad esempio, quelli che hanno eseguito un esercizio di meditazione rispetto a quelli che non l’hanno fatto).
- In un design all’interno dei soggetti, si confrontano le misure ripetute dei partecipanti che hanno partecipato a tutti i trattamenti di uno studio (ad esempio, i punteggi di prima e dopo l’esecuzione di un esercizio di meditazione).
- Sperimentale
- Correlazionale
Misurazione delle variabili
Quando si pianifica un progetto di ricerca, è necessario rendere operative le variabili e decidere esattamente come misurarle.
Per l’analisi statistica, è importante considerare il livello di misurazione delle variabili, che indica il tipo di dati che contengono:
- I dati categoriali rappresentano i raggruppamenti. Questi possono essere nominali (ad es., genere) o ordinale (ad esempio livello di abilità linguistica).
- I dati quantitativi rappresentano gli importi. Questi possono essere su una scala di intervallo (ad esempio punteggio del test) o una scala di rapporto (ad esempio età).
Molte variabili possono essere misurate a diversi livelli di precisione. Ad esempio, i dati sull’età possono essere quantitativi (8 anni) o categoriali (giovani). Se una variabile è codificata numericamente (ad esempio, livello di accordo da 1-5), non significa automaticamente che sia quantitativa anziché categorica.
Identificare il livello di misurazione è importante per la scelta di statistiche appropriate e test di ipotesi. Ad esempio, è possibile calcolare un punteggio medio con dati quantitativi, ma non con dati categoriali.
In uno studio di ricerca, insieme alle misure delle variabili di interesse, raccoglierai spesso dati sulle caratteristiche rilevanti dei partecipanti.
- Sperimentale
- Correlazionale
Variabile | Tipo di dati |
---|---|
Età | Quantitativi (rapporto) |
Genere | Categorico (nominale) |
la Razza o l’etnia | Categorico (nominale) |
test di riferimento punteggi | Quantitativi (intervallo) |
Finale i punteggi dei test | Quantitativi (intervallo) |
Variabile | Tipo di dati |
---|---|
il reddito dei Genitori | Quantitativi (rapporto) |
GPA | Quantitativi (intervallo) |
Passo 2: Raccogliere dati da un campione
Nella maggior parte dei casi, è troppo difficile o costoso raccogliere dati da ogni membro della popolazione che ti interessa studiare. Invece, raccoglierai dati da un campione.
L’analisi statistica consente di applicare i risultati oltre il proprio campione, purché si utilizzino procedure di campionamento appropriate. Dovresti mirare a un campione rappresentativo della popolazione.
Campionamento per analisi statistica
Esistono due approcci principali per selezionare un campione.
- Campionamento probabilistico: ogni membro della popolazione ha la possibilità di essere selezionato per lo studio attraverso la selezione casuale.
- Campionamento non probabilistico: alcuni membri della popolazione hanno più probabilità di altri di essere selezionati per lo studio a causa di criteri come la convenienza o l’auto-selezione volontaria.
In teoria, per risultati altamente generalizzabili, è necessario utilizzare un metodo di campionamento probabilistico. La selezione casuale riduce il bias di campionamento e garantisce che i dati del campione siano effettivamente tipici della popolazione. I test parametrici possono essere utilizzati per effettuare forti inferenze statistiche quando i dati vengono raccolti utilizzando il campionamento di probabilità.
Ma in pratica, raramente è possibile raccogliere il campione ideale. Mentre i campioni non probabilistici hanno maggiori probabilità di essere prevenuti, sono molto più facili da reclutare e raccogliere dati. I test non parametrici sono più appropriati per i campioni non probabilistici, ma si traducono in inferenze più deboli sulla popolazione.
Se si desidera utilizzare test parametrici per campioni non probabilistici, è necessario fare in modo che:
- il tuo campione è rappresentativo della popolazione a cui stai generalizzando i tuoi risultati.
- il tuo campione manca di pregiudizi sistematici.
Tieni presente che la validità esterna significa che puoi generalizzare le tue conclusioni solo ad altri che condividono le caratteristiche del tuo campione. Ad esempio, i risultati di campioni occidentali, istruiti, industrializzati, ricchi e democratici (ad es., gli studenti universitari negli Stati Uniti) non sono automaticamente applicabili a tutte le popolazioni non STRANE.
Se si applicano test parametrici a dati provenienti da campioni non probabilistici, assicurarsi di approfondire i limiti di quanto i risultati possono essere generalizzati nella sezione di discussione.
Crea una procedura di campionamento appropriata
In base alle risorse disponibili per la tua ricerca, decidi come reclutare i partecipanti.
- Avrai risorse per pubblicizzare ampiamente il tuo studio, anche al di fuori del tuo ambiente universitario?
- Avrai i mezzi per reclutare un campione diversificato che rappresenti un’ampia popolazione?
- Hai tempo per contattare e seguire i membri di gruppi difficili da raggiungere?
- Sperimentale
- Correlazionale
Calcola la dimensione del campione sufficiente
Prima di reclutare i partecipanti, decidi la dimensione del campione esaminando altri studi nel tuo campo o utilizzando le statistiche. Un campione troppo piccolo potrebbe non essere rappresentativo del campione, mentre un campione troppo grande sarà più costoso del necessario.
Ci sono molti calcolatori di dimensioni del campione online. Vengono utilizzate formule diverse a seconda che tu abbia sottogruppi o quanto debba essere rigoroso il tuo studio (ad esempio, nella ricerca clinica). Come regola generale, è necessario un minimo di 30 unità o più per sottogruppo.
Per utilizzare questi calcolatori, è necessario comprendere e inserire questi componenti chiave:
- Livello di significatività (alfa): il rischio di rifiutare una vera ipotesi nulla che si è disposti a prendere, di solito fissato al 5%.
- Potenza statistica: la probabilità che il tuo studio rilevi un effetto di una certa dimensione se ce n’è uno, di solito dell ‘ 80% o superiore.
- Dimensione effetto previsto: un’indicazione standardizzata di quanto grande sarà il risultato atteso del tuo studio, di solito basato su altri studi simili.
- Deviazione standard della popolazione: stima del parametro della popolazione sulla base di uno studio precedente o di uno studio pilota.
Passo 3: Riassumere i dati con le statistiche descrittive
una Volta raccolti tutti i dati, è possibile ispezionare e calcolare le statistiche descrittive che riassumere.
Ispeziona i tuoi dati
Esistono vari modi per ispezionare i tuoi dati, tra cui i seguenti:
- Organizzazione dei dati da ciascuna variabile nelle tabelle di distribuzione della frequenza.
- Visualizzazione dei dati da una variabile chiave in un grafico a barre per visualizzare la distribuzione delle risposte.
- Visualizzazione della relazione tra due variabili utilizzando un grafico a dispersione.
Visualizzando i dati in tabelle e grafici, è possibile valutare se i dati seguono una distribuzione distorta o normale e se ci sono valori anomali o dati mancanti.
Una distribuzione normale significa che i dati sono distribuiti simmetricamente attorno a un centro in cui si trovano la maggior parte dei valori, con i valori che si assottigliano alle estremità della coda.
Al contrario, una distribuzione inclinata è asimmetrica e ha più valori su un’estremità rispetto all’altra. La forma della distribuzione è importante da tenere a mente perché solo alcune statistiche descrittive dovrebbero essere utilizzate con distribuzioni distorte.
I valori anomali estremi possono anche produrre statistiche fuorvianti, quindi potrebbe essere necessario un approccio sistematico per gestire questi valori.
Calcola le misure di tendenza centrale
Le misure di tendenza centrale descrivono dove si trovano la maggior parte dei valori in un set di dati. Tre misure principali di tendenza centrale sono spesso riportate:
- Modalità: la risposta o il valore più popolare nel set di dati.
- Mediana: il valore nel mezzo esatto del set di dati quando ordinato dal basso verso l’alto.
- Media: la somma di tutti i valori divisa per il numero di valori.
Tuttavia, a seconda della forma della distribuzione e del livello di misurazione, solo una o due di queste misure possono essere appropriate. Ad esempio, molte caratteristiche demografiche possono essere descritte solo utilizzando la modalità o le proporzioni, mentre una variabile come il tempo di reazione potrebbe non avere affatto una modalità.
Calcola le misure di variabilità
Le misure di variabilità indicano la distribuzione dei valori in un set di dati. Sono spesso riportate quattro principali misure di variabilità:
- Intervallo: il valore più alto meno il valore più basso del set di dati.
- Intervallo interquartile: intervallo della metà centrale del set di dati.
- Deviazione standard: la distanza media tra ciascun valore nel set di dati e la media.
- Varianza: il quadrato della deviazione standard.
Ancora una volta, la forma della distribuzione e il livello di misurazione dovrebbero guidare la scelta delle statistiche di variabilità. L’intervallo interquartile è la misura migliore per le distribuzioni distorte, mentre la deviazione standard e la varianza forniscono le migliori informazioni per le distribuzioni normali.
- Sperimentale
- Correlazionale
Utilizzando la tabella, è necessario verificare se le unità delle statistiche descrittive sono comparabili per i punteggi pre-test e post-test. Ad esempio, i livelli di varianza sono simili tra i gruppi? Ci sono valori estremi? Se ci sono, potrebbe essere necessario identificare e rimuovere valori anomali estremi nel set di dati o trasformare i dati prima di eseguire un test statistico.
Pre-test punteggi | post-test i punteggi | |
---|---|---|
Media | 68.44 | 75.25 |
deviazione Standard | 9.43 | 9.88 |
Varianza | 88.96 | 97.96 |
Gamma | 36.25 | 45.12 |
N | 30 |
Da questa tabella si può vedere che la media di punteggio è aumentato dopo l’esercizio di meditazione, e le varianze dei due punteggi sono paragonabili. Successivamente, possiamo eseguire un test statistico per scoprire se questo miglioramento nei punteggi dei test è statisticamente significativo nella popolazione.
È importante verificare se si dispone di una vasta gamma di punti dati. Se non lo fai, i tuoi dati potrebbero essere distorti verso alcuni gruppi più di altri (ad esempio, alti achievers accademici), e solo inferenze limitate possono essere fatte su una relazione.
Reddito parentale (USD) | GPA | |
---|---|---|
Media | 62,100 | 3.12 |
deviazione Standard | 15,000 | 0.45 |
Varianza | 225,000,000 | 0.16 |
Gamma | 8,000–378,000 | 2.64–4.00 |
N | 653 |
a quel punto, siamo in grado di calcolare un coefficiente di correlazione e di eseguire un test statistico per comprendere il significato della relazione tra le variabili nella popolazione.
Punto 4: Verifica ipotesi o effettua stime con statistiche inferenziali
Un numero che descrive un campione è chiamato statistica, mentre un numero che descrive una popolazione è chiamato parametro. Utilizzando le statistiche inferenziali, è possibile trarre conclusioni sui parametri della popolazione in base alle statistiche di esempio.
I ricercatori usano spesso due metodi principali (simultaneamente) per fare inferenze nelle statistiche.
- Stima: calcolo dei parametri di popolazione basati su statistiche campione.
- Test di ipotesi: un processo formale per testare le previsioni di ricerca sulla popolazione utilizzando campioni.
Stima
È possibile effettuare due tipi di stime dei parametri di popolazione dalle statistiche di esempio:
- Una stima puntuale: un valore che rappresenta la migliore ipotesi del parametro esatto.
- Una stima dell’intervallo: un intervallo di valori che rappresentano la migliore ipotesi su dove si trova il parametro.
Se il tuo obiettivo è quello di dedurre e riportare le caratteristiche della popolazione dai dati di esempio, è meglio utilizzare sia le stime puntuali che quelle intervallate nel tuo documento.
È possibile considerare una statistica campione una stima puntuale per il parametro della popolazione quando si dispone di un campione rappresentativo (ad esempio, in un ampio sondaggio di opinione pubblica, la percentuale di un campione che supporta il governo corrente viene presa come la percentuale di popolazione dei sostenitori del governo).
C’è sempre un errore nella stima, quindi dovresti anche fornire un intervallo di confidenza come stima dell’intervallo per mostrare la variabilità attorno a una stima puntuale.
Un intervallo di confidenza utilizza l’errore standard e il punteggio z della distribuzione normale standard per trasmettere dove generalmente ci si aspetta di trovare il parametro di popolazione la maggior parte del tempo.
Test di ipotesi
Utilizzando i dati di un campione, è possibile testare ipotesi sulle relazioni tra variabili nella popolazione. Il test di ipotesi inizia con l’ipotesi che l’ipotesi nulla sia vera nella popolazione e si utilizzano test statistici per valutare se l’ipotesi nulla può essere respinta o meno.
I test statistici determinano dove si troverebbero i dati di esempio su una distribuzione prevista di dati di esempio se l’ipotesi nulla fosse vera. Questi test forniscono due risultati principali:
- Una statistica di test ti dice quanto i tuoi dati differiscono dall’ipotesi nulla del test.
- Un valore p indica la probabilità di ottenere i risultati se l’ipotesi nulla è effettivamente vera nella popolazione.
I test statistici sono disponibili in tre varietà principali:
- I test di confronto valutano le differenze di gruppo nei risultati.
- I test di regressione valutano le relazioni causa-effetto tra le variabili.
- I test di correlazione valutano le relazioni tra le variabili senza assumere la causalità.
La scelta del test statistico dipende dalle domande di ricerca, dal design della ricerca, dal metodo di campionamento e dalle caratteristiche dei dati.
Test parametrici
I test parametrici fanno potenti inferenze sulla popolazione basate su dati campione. Ma per usarli, alcune ipotesi devono essere soddisfatte e solo alcuni tipi di variabili possono essere utilizzati. Se i dati violano queste ipotesi, è possibile eseguire trasformazioni di dati appropriate o utilizzare test alternativi non parametrici.
Una regressione modella la misura in cui i cambiamenti in una variabile predittiva determinano cambiamenti nelle variabili di risultato.
- Una regressione lineare semplice include una variabile predittiva e una variabile di risultato.
- Una regressione lineare multipla include due o più variabili predittive e una variabile di risultato.
I test di confronto di solito confrontano i mezzi dei gruppi. Questi possono essere i mezzi di diversi gruppi all’interno di un campione (ad esempio, un gruppo di trattamento e di controllo), i mezzi di un gruppo di campioni prelevati in momenti diversi (ad esempio, i punteggi pre-test e post-test), o una media del campione e una media della popolazione.
- Un test t è per esattamente 1 o 2 gruppi quando il campione è piccolo (30 o meno).
- Un test z è per esattamente 1 o 2 gruppi quando il campione è grande.
- Un ANOVA è per 3 o più gruppi.
I test z e t hanno sottotipi in base al numero e ai tipi di campioni e alle ipotesi:
- Se si dispone di un solo campione che si desidera confrontare con una media di popolazione, utilizzare un test di un campione.
- Se si dispone di misurazioni accoppiate (design all’interno dei soggetti), utilizzare un test di campioni dipendenti (accoppiati).
- Se si dispone di misurazioni completamente separate da due gruppi non corrispondenti (progettazione tra soggetti), utilizzare un test di campioni indipendenti.
- Se si prevede una differenza tra i gruppi in una direzione specifica, utilizzare un test a coda singola.
- Se non hai aspettative sulla direzione di una differenza tra i gruppi, usa un test a due code.
L’unico test di correlazione parametrica è r di Pearson. Il coefficiente di correlazione (r) indica la forza di una relazione lineare tra due variabili quantitative.
Tuttavia, per verificare se la correlazione nel campione è abbastanza forte da essere importante nella popolazione, è anche necessario eseguire un test di significatività del coefficiente di correlazione, di solito un test t, per ottenere un valore p. Questo test utilizza la dimensione del campione per calcolare quanto il coefficiente di correlazione differisce da zero nella popolazione.
- Sperimentale
- Correlazionale
Punto 5: Interpretare i risultati
La fase finale dell’analisi statistica è interpretare i risultati.
Significatività statistica
Nel test di ipotesi, la significatività statistica è il criterio principale per formare conclusioni. Si confronta il valore p con un livello di significatività impostato (di solito 0,05) per decidere se i risultati sono statisticamente significativi o non significativi.
I risultati statisticamente significativi sono considerati improbabili solo a causa del caso. C’è solo una probabilità molto bassa che un tale risultato si verifichi se l’ipotesi nulla è vera nella popolazione.
- Sperimentale
- Correlazionale
Dimensione effetto
Un risultato statisticamente significativo non significa necessariamente che ci sono importanti applicazioni di vita reale o risultati clinici per una constatazione.
Al contrario, la dimensione dell’effetto indica il significato pratico dei risultati. È importante segnalare le dimensioni degli effetti insieme alle statistiche inferenziali per un quadro completo dei risultati. Dovresti anche segnalare le stime dell’intervallo delle dimensioni degli effetti se stai scrivendo un documento in stile APA.
- Sperimentale
- Correlazionale
Errori decisionali
Gli errori di tipo I e di tipo II sono errori commessi nelle conclusioni della ricerca. Un errore di tipo I significa rifiutare l’ipotesi nulla quando è effettivamente vero, mentre un errore di tipo II significa non riuscire a rifiutare l’ipotesi nulla quando è falsa.
È possibile mirare a ridurre al minimo il rischio di questi errori selezionando un livello di significatività ottimale e garantendo un’elevata potenza. Tuttavia, c’è un compromesso tra i due errori, quindi è necessario un buon equilibrio.
Statistica frequentista contro statistica bayesiana
Tradizionalmente, la statistica frequentista enfatizza il test del significato dell’ipotesi nulla e inizia sempre con l’assunzione di una vera ipotesi nulla.
Tuttavia, le statistiche bayesiane sono cresciute in popolarità come approccio alternativo negli ultimi decenni. In questo approccio, usi ricerche precedenti per aggiornare continuamente le tue ipotesi in base alle tue aspettative e osservazioni.
Il fattore di Bayes confronta la forza relativa dell’evidenza per il nullo rispetto all’ipotesi alternativa piuttosto che fare una conclusione sul rifiuto o meno dell’ipotesi nulla.
Domande frequenti sull’analisi statistica
L’analisi statistica è il metodo principale per analizzare i dati di ricerca quantitativa. Utilizza probabilità e modelli per testare le previsioni su una popolazione da dati di esempio.
Le statistiche descrittive riassumono le caratteristiche di un set di dati. Le statistiche inferenziali consentono di testare un’ipotesi o valutare se i dati sono generalizzabili per la popolazione più ampia.
Il test di ipotesi è una procedura formale per indagare le nostre idee sul mondo usando le statistiche. Viene utilizzato dagli scienziati per testare previsioni specifiche, chiamate ipotesi, calcolando quanto è probabile che un modello o una relazione tra variabili possa essere sorto per caso.
Nel test di ipotesi statistica, l’ipotesi nulla di un test prevede sempre alcun effetto o nessuna relazione tra variabili, mentre l’ipotesi alternativa afferma la previsione di ricerca di un effetto o di una relazione.
La significatività statistica è un termine usato dai ricercatori per affermare che è improbabile che le loro osservazioni possano essersi verificate sotto l’ipotesi nulla di un test statistico. Il significato è solitamente indicato da un valore p o valore di probabilità.
La significatività statistica è arbitraria – dipende dalla soglia, o dal valore alfa, scelto dal ricercatore. La soglia più comune è p < 0,05, il che significa che è probabile che i dati si verifichino meno del 5% delle volte sotto l’ipotesi nulla.
Quando il valore p scende al di sotto del valore alfa scelto, diciamo che il risultato del test è statisticamente significativo.