teoria din spatele valorilor p și ipoteza nulă ar putea părea complicată la început, dar înțelegerea conceptelor vă va ajuta să navigați în lumea statisticilor. Din păcate, acești termeni sunt adesea folosiți greșit în știința populară, deci ar fi util ca toată lumea să înțeleagă elementele de bază.
calcularea valorii p a unui model și dovedirea/respingerea ipotezei nule este surprinzător de simplă cu MS Excel. Există două moduri de a face acest lucru și le vom acoperi pe amândouă. Să săpăm.
ipoteza nulă și valoarea p
ipoteza nulă este o afirmație, denumită și poziție implicită, care susține că relația dintre fenomenele observate este inexistentă. Poate fi aplicat și asociațiilor dintre două grupuri observate. În timpul cercetării, testați această ipoteză și încercați să o respingeți.
de exemplu, spuneți că doriți să observați dacă o anumită dietă moft are rezultate semnificative. Ipoteza nulă, în acest caz, este că nu există nicio diferență semnificativă în greutatea subiecților testați înainte și după dietă. Ipoteza alternativă este că dieta a făcut diferența. Aceasta este ceea ce cercetătorii ar încerca să demonstreze.
valoarea p reprezintă șansa ca rezumatul statistic să fie egal sau mai mare decât valoarea observată atunci când ipoteza nulă este adevărată pentru un anumit model statistic. Deși este adesea exprimat ca număr zecimal, este în general mai bine să-l exprimați ca procent. De exemplu, valoarea p de 0,1 ar trebui să fie reprezentată ca 10%.
o valoare p scăzută înseamnă că dovezile împotriva ipotezei nule sunt puternice. Acest lucru înseamnă în continuare că datele dvs. sunt semnificative. Pe de altă parte, o valoare p ridicată înseamnă că nu există dovezi puternice împotriva ipotezei. Pentru a dovedi că dieta fad funcționează, cercetătorii ar trebui să găsească o valoare p scăzută.
un rezultat semnificativ statistic este cel care este foarte puțin probabil să se întâmple dacă ipoteza nulă este adevărată. Nivelul de semnificație este notat cu litera greacă alfa și trebuie să fie mai mare decât valoarea p pentru ca rezultatul să fie semnificativ statistic.
mulți cercetători dintr-o gamă largă de domenii folosesc valoarea p pentru a obține o perspectivă mai bună și mai profundă asupra datelor cu care lucrează. Unele dintre domeniile proeminente includ Sociologie, justiție penală, Psihologie, finanțe și economie.
găsirea valorii p în Excel 2010
puteți găsi valoarea p a unui set de date în MS Excel prin funcția T-Test sau utilizând instrumentul de analiză a datelor. În primul rând, vom analiza funcția T-Test. Vom examina cinci studenți care au urmat o dietă de 30 de zile. Vom compara greutatea lor înainte și după dietă.
notă: în sensul acestui articol, îl vom împărți în MS Excel 2010 și 2016. Deși pașii ar trebui să se aplice în general tuturor versiunilor, aspectul meniurilor și fleacurile vor diferi.
funcția T-Test
urmați acești pași pentru a calcula valoarea p cu funcția T-Test.
- creați și populați tabelul. Masa noastră arată astfel:
- Faceți clic pe orice celulă din afara tabelului.
- introduceți: = T. Test(.
- după paranteza deschisă, tastați primul argument. În acest exemplu, este coloana before Diet. Intervalul trebuie să fie B2:B6. Până în prezent, funcția arată astfel: T. Test(B2:B6.
- apoi, vom introduce al doilea argument. Coloana după dietă și rezultatele sale sunt al doilea argument al nostru, iar intervalul de care avem nevoie este C2:C6. Să o adăugăm la formula: T. Test(B2:B6,C2:C6.
- introduceți o virgulă după al doilea argument și opțiunile de distribuție cu o singură coadă și cu două cozi vor apărea automat într-un meniu derulant. Să alegem prima distribuție cu o singură coadă. Faceți dublu clic pe el.
- introduceți o altă virgulă.
- faceți dublu clic pe opțiunea pereche din următorul meniu derulant.
- acum că aveți toate elementele de care aveți nevoie, închideți suportul. Formula pentru acest exemplu arată astfel: = T. Test(B2:B6,C2: C6,1,1)
- apăsați Enter. Celula va afișa imediat valoarea P. În cazul nostru, valoarea este de 0,133905569 sau 13,3905569%.
fiind mai mare de 5%, această valoare p nu oferă dovezi puternice împotriva ipotezei nule. În exemplul nostru, cercetarea nu a dovedit că dieta a ajutat subiecții testați să piardă o cantitate semnificativă de greutate. Aceasta nu înseamnă neapărat că ipoteza nulă este corectă, ci doar că nu a fost încă respinsă.
traseu de analiză a datelor
instrumentul de analiză a datelor vă permite să faceți multe lucruri interesante, inclusiv calcule de valoare P. Pentru a simplifica lucrurile, vom folosi același tabel ca în metoda anterioară.
Iată cum se face.
- deoarece avem deja diferențele de greutate în coloana D, vom sări peste calculul diferenței. Pentru tabelele viitoare, Utilizați această formulă: =”celula 1″ – „celula 2”.
- apoi, faceți clic pe fila Date din meniul principal.
- selectați instrumentul de analiză a datelor.
- Derulați în jos lista și faceți clic pe opțiunea T-Test: Paired Two Sample for Means.
- Faceți clic pe OK.
- va apărea o fereastră pop-up. Se pare ca acest lucru:
- introduceți primul interval / argument. În exemplul nostru, este B2: B6.
- introduceți al doilea interval/argument. În acest caz, este C2:C6.
- lăsați valoarea implicită în caseta de text alfa (este 0,05).
- Faceți clic pe butonul radio Output Range și alegeți unde doriți rezultatul. Dacă este celula A8, tastați: $a$8.
- Faceți clic pe OK.
- Excel va calcula valoarea p și alți câțiva parametri. Masa finală ar putea arăta astfel:
după cum puteți vedea, valoarea p cu o singură coadă este aceeași ca în primul caz-0,133905569. Deoarece este peste 0.05, ipoteza nulă se aplică pentru acest tabel, iar dovezile împotriva acestuia sunt slabe.
găsirea valorii p în Excel 2016
Similar cu pașii de mai sus, să acoperim calcularea valorii p în Excel 2016.
- vom folosi același exemplu ca mai sus, deci creați tabelul dacă doriți să urmați.
- acum, în celula A8, type = T. Test (B2:B6, C2:C6
- apoi, în celula A8, introduceți o virgulă după C6 și apoi selectați distribuție cu o singură coadă.
- apoi, introduceți o altă virgulă și selectați pereche.
- ecuația ar trebui să fie acum =T. Test(B2:B6, C2:C6,1,1).
- în cele din urmă, apăsați Enter pentru a afișa rezultatul.
rezultatele pot varia cu câteva zecimale, în funcție de setările și spațiul disponibil pe ecran.
lucruri de știut despre valoarea p
iată câteva sfaturi utile cu privire la calculele valorii p în Excel.
- dacă valoarea p este egală cu 0,05 (5%), datele din tabelul dvs. sunt semnificative. Dacă este mai mică de 0.05 (5%), datele pe care le aveți sunt foarte semnificative.
- în cazul în care valoarea p este mai mare de 0,1 (10%), datele din tabelul dvs. sunt nesemnificative. Dacă este în intervalul 0.05-0.10, aveți date marginal semnificative.
- puteți modifica valoarea alfa, deși cele mai frecvente opțiuni sunt 0,05 (5%) și 0,10 (10%).
- alegerea testării cu două cozi poate fi cea mai bună alegere, în funcție de ipoteza dvs. În exemplul de mai sus, testarea cu o singură coadă înseamnă că explorăm dacă subiecții testați au pierdut în greutate după dietă și exact asta trebuia să aflăm. Dar un test cu două cozi ar examina, de asemenea, dacă au câștigat cantități semnificative statistic de greutate.
- valoarea p nu poate identifica variabilele. Cu alte cuvinte, dacă identifică o corelație, nu poate identifica cauzele din spatele ei.
valoarea p Demistificată
fiecare statistician care își merită sarea trebuie să cunoască dedesubturile testării ipotezelor nule și ce înseamnă valoarea P. Aceste cunoștințe vor fi utile și cercetătorilor din multe alte domenii.