La teoria dietro i valori p e l’ipotesi nulla potrebbe sembrare complicata all’inizio, ma comprendere i concetti ti aiuterà a navigare nel mondo delle statistiche. Sfortunatamente, questi termini sono spesso usati in modo improprio nella scienza popolare, quindi sarebbe utile per tutti capire le basi.
Calcolare il valore p di un modello e dimostrare/confutare l’ipotesi nulla è sorprendentemente semplice con MS Excel. Ci sono due modi per farlo e li copriremo entrambi. Scaviamo.
Ipotesi nulla e p-Value
L’ipotesi nulla è una dichiarazione, indicata anche come posizione predefinita, che afferma che la relazione tra i fenomeni osservati è inesistente. Può anche essere applicato alle associazioni tra due gruppi osservati. Durante la ricerca, provi questa ipotesi e cerchi di confutarla.
Ad esempio, diciamo che vuoi osservare se una particolare dieta di moda ha risultati significativi. L’ipotesi nulla, in questo caso, è che non vi sia alcuna differenza significativa nel peso dei soggetti del test prima e dopo la dieta. L’ipotesi alternativa è che la dieta ha fatto la differenza. Questo è ciò che i ricercatori cercherebbero di dimostrare.
Il valore p rappresenta la possibilità che il sommario statistico sia uguale o maggiore del valore osservato quando l’ipotesi nulla è vera per un determinato modello statistico. Anche se è spesso espresso come un numero decimale, è generalmente meglio esprimerlo come percentuale. Ad esempio, il valore p di 0.1 dovrebbe essere rappresentato come 10%.
Un valore p basso significa che l’evidenza contro l’ipotesi nulla è forte. Ciò significa inoltre che i tuoi dati sono significativi. D’altra parte, un alto valore p significa che non ci sono prove forti contro l’ipotesi. Per dimostrare che la dieta fad funziona, i ricercatori avrebbero bisogno di trovare un basso valore P.
Un risultato statisticamente significativo è quello che è altamente improbabile che accada se l’ipotesi nulla è vera. Il livello di significatività è indicato con la lettera greca alfa e deve essere maggiore del valore p affinché il risultato sia statisticamente significativo.
Molti ricercatori in una vasta gamma di campi utilizzano il valore p per ottenere una visione migliore e più profonda dei dati con cui stanno lavorando. Alcuni dei campi di spicco includono sociologia, giustizia penale, psicologia, finanza ed economia.
Trovare il valore p in Excel 2010
È possibile trovare il valore p di un set di dati in MS Excel tramite la funzione T-Test o utilizzando lo strumento di analisi dei dati. Per prima cosa, esamineremo la funzione T-Test. Esamineremo cinque studenti universitari che hanno seguito una dieta di 30 giorni. Confronteremo il loro peso prima e dopo la dieta.
NOTA: ai fini di questo articolo, lo divideremo in MS Excel 2010 e 2016. Anche se i passaggi dovrebbero generalmente applicarsi a tutte le versioni, il layout dei menu e quant’altro sarà diverso.
Funzione T-Test
Seguire questi passaggi per calcolare il valore p con la funzione T-Test.
- Crea e compila la tabella. Il nostro tavolo assomiglia a questo:
- Fai clic su qualsiasi cella al di fuori del tuo tavolo.
- Digitare: = T. Test(.
- Dopo la parentesi aperta, digitare il primo argomento. In questo esempio, è la colonna Prima della dieta. L’intervallo dovrebbe essere B2: B6. Finora, la funzione è simile a questa: T. Test (B2: B6.
- Successivamente, entreremo nel secondo argomento. La colonna Dopo la dieta e i suoi risultati sono il nostro secondo argomento e l’intervallo di cui abbiamo bisogno è C2:C6. Aggiungiamolo alla formula: T. Test (B2: B6, C2: C6.
- Digitare una virgola dopo il secondo argomento e le opzioni di distribuzione a una coda e a due code appariranno automaticamente in un menu a discesa. Scegliamo la prima distribuzione a una coda. Fare doppio clic su di esso.
- Digitare un’altra virgola.
- Fare doppio clic sull’opzione Accoppiata nel menu a discesa successivo.
- Ora che hai tutti gli elementi necessari, chiudi la parentesi. La formula per questo esempio è simile a questa: = T. Test(B2: B6,C2: C6,1,1)
- Premere Invio. La cella visualizzerà immediatamente il valore P. Nel nostro caso, il valore è 0,133905569 o 13,3905569%.
Essendo superiore al 5%, questo valore p non fornisce una forte prova contro l’ipotesi nulla. Nel nostro esempio, la ricerca non ha dimostrato che la dieta ha aiutato i soggetti del test a perdere una quantità significativa di peso. Questo non significa necessariamente che l’ipotesi nulla sia corretta, solo che non è stata ancora smentita.
Percorso di analisi dei dati
Lo strumento di analisi dei dati ti consente di fare molte cose interessanti, inclusi i calcoli del valore P. Per semplificare le cose, useremo la stessa tabella del metodo precedente.
Ecco come si fa.
- Poiché abbiamo già le differenze di peso nella colonna D, salteremo il calcolo della differenza. Per le tabelle future, utilizzare questa formula: = “Cella 1” – “Cella 2”.
- Quindi, fare clic sulla scheda Dati nel menu principale.
- Selezionare lo strumento di analisi dei dati.
- Scorri verso il basso l’elenco e fai clic sull’opzione t-Test: accoppiati due campioni per i mezzi.
- Fare clic su OK.
- Apparirà una finestra pop-up. Sembra questo:
- Immettere il primo intervallo / argomento. Nel nostro esempio, è B2: B6.
- Immettere il secondo intervallo / argomento. In questo caso, è C2: C6.
- Lasciare il valore predefinito nella casella di testo Alfa (è 0.05).
- Fare clic sul pulsante di opzione Intervallo di uscita e scegliere dove si desidera che il risultato. Se è la cella A8, digitare: A A 8 8.
- Fare clic su OK.
- Excel calcolerà il valore p e molti altri parametri. Il tavolo finale potrebbe essere simile a questo:
Come puoi vedere, il valore p a una coda è lo stesso del primo caso: 0,133905569. Dal momento che è sopra 0.05, l’ipotesi nulla si applica a questa tabella e le prove contro di essa sono deboli.
Trovare il valore p in Excel 2016
Simile ai passaggi precedenti, copriamo il calcolo del valore p in Excel 2016.
- Useremo lo stesso esempio di cui sopra, quindi crea la tabella se vuoi seguire.
- Ora, nella cella A8, type = T. Test (B2: B6, C2: C6
- Quindi, nella cella A8, immettere una virgola dopo C6 e quindi selezionare Distribuzione a coda unica.
- Quindi, immettere un’altra virgola e selezionare Accoppiato.
- L’equazione dovrebbe ora essere = T. Test(B2:B6, C2:C6,1,1).
- Infine, premere Invio per visualizzare il risultato.
I risultati possono variare di pochi decimali a seconda delle impostazioni e dello spazio disponibile sullo schermo.
Cose da sapere sul valore p
Ecco alcuni consigli utili per quanto riguarda i calcoli del valore p in Excel.
- Se il valore p è uguale a 0,05 (5%), i dati nella tabella sono significativi. Se è inferiore a 0.05 (5%), i dati che hai sono altamente significativi.
- Nel caso in cui il valore p sia superiore a 0,1 (10%), i dati nella tabella sono insignificanti. Se è nell’intervallo 0,05-0,10, hai dati marginalmente significativi.
- È possibile modificare il valore alfa, anche se le opzioni più comuni sono 0,05 (5%) e 0,10 (10%).
- La scelta di test a due code può essere la scelta migliore, a seconda della tua ipotesi. Nell’esempio sopra, test one-tailed significa che esploriamo se i soggetti del test hanno perso peso dopo la dieta, e questo è esattamente ciò di cui avevamo bisogno per scoprirlo. Ma un test a due code esaminerebbe anche se hanno guadagnato quantità statisticamente significative di peso.
- Il valore p non può identificare le variabili. In altre parole, se identifica una correlazione, non può identificare le cause dietro di essa.
Il valore p demistificato
Ogni statistico degno del suo sale deve conoscere i dettagli del test di ipotesi nulla e cosa significa il valore P. Questa conoscenza sarà utile anche ai ricercatori in molti altri campi.