La théorie derrière les valeurs p et l’hypothèse nulle peut sembler compliquée au début, mais comprendre les concepts vous aidera à naviguer dans le monde des statistiques. Malheureusement, ces termes sont souvent mal utilisés dans la science populaire, il serait donc utile que tout le monde comprenne les bases.
Calculer la valeur p d’un modèle et prouver / réfuter l’hypothèse nulle est étonnamment simple avec MS Excel. Il y a deux façons de le faire et nous les couvrirons toutes les deux. Creusons.
Hypothèse nulle et valeur p
L’hypothèse nulle est une déclaration, également appelée position par défaut, qui prétend que la relation entre les phénomènes observés est inexistante. Elle peut également s’appliquer aux associations entre deux groupes observés. Au cours de la recherche, vous testez cette hypothèse et essayez de la réfuter.
Par exemple, disons que vous voulez observer si un régime à la mode particulier a des résultats significatifs. L’hypothèse nulle, dans ce cas, est qu’il n’y a pas de différence significative dans le poids des sujets testés avant et après un régime. L’hypothèse alternative est que le régime a fait une différence. C’est ce que les chercheurs tenteraient de prouver.
La valeur p représente la chance que le résumé statistique soit égal ou supérieur à la valeur observée lorsque l’hypothèse nulle est vraie pour un certain modèle statistique. Bien qu’il soit souvent exprimé en nombre décimal, il est généralement préférable de l’exprimer en pourcentage. Par exemple, la valeur p de 0,1 doit être représentée par 10%.
Une valeur p faible signifie que la preuve contre l’hypothèse nulle est forte. Cela signifie en outre que vos données sont importantes. D’un autre côté, une valeur p élevée signifie qu’il n’y a aucune preuve solide contre l’hypothèse. Pour prouver que le régime à la mode fonctionne, les chercheurs devraient trouver une faible valeur p.
Un résultat statistiquement significatif est celui qui a très peu de chances de se produire si l’hypothèse nulle est vraie. Le niveau de signification est noté avec la lettre grecque alpha et il doit être supérieur à la valeur p pour que le résultat soit statistiquement significatif.
De nombreux chercheurs dans un large éventail de domaines utilisent la valeur p pour obtenir un aperçu meilleur et plus approfondi des données avec lesquelles ils travaillent. Certains des domaines importants incluent la sociologie, la justice pénale, la psychologie, la finance et l’économie.
Trouver la valeur p dans Excel 2010
Vous pouvez trouver la valeur p d’un ensemble de données dans MS Excel via la fonction T-Test ou à l’aide de l’outil d’analyse de données. Tout d’abord, nous examinerons la fonction T-Test. Nous examinerons cinq étudiants qui ont suivi un régime de 30 jours. Nous comparerons leur poids avant et après le régime.
REMARQUE: Pour les besoins de cet article, nous le diviserons en MS Excel 2010 et 2016. Bien que les étapes devraient généralement s’appliquer à toutes les versions, la disposition des menus et autres différera.
Fonction T-Test
Suivez ces étapes pour calculer la valeur p avec la fonction T-Test.
- Créez et remplissez la table. Notre table ressemble à ceci:
- Cliquez sur une cellule en dehors de votre table.
- Entrez : = T.Test (.
- Après la parenthèse ouverte, tapez le premier argument. Dans cet exemple, il s’agit de la colonne Avant le régime. La plage doit être B2: B6. Jusqu’à présent, la fonction ressemble à ceci: T.Test(B2:B6.
- Ensuite, nous entrerons dans le deuxième argument. La colonne After Diet et ses résultats sont notre deuxième argument et la plage dont nous avons besoin est C2: C6. Ajoutons-le à la formule: T.Test (B2: B6, C2: C6.
- Tapez une virgule après le deuxième argument et les options de distribution à une queue et de distribution à deux queues apparaîtront automatiquement dans un menu déroulant. Choisissons la première distribution à une queue. Double-cliquez dessus.
- Tapez une autre virgule.
- Double-cliquez sur l’option Jumelée dans le menu déroulant suivant.
- Maintenant que vous avez tous les éléments dont vous avez besoin, fermez le support. La formule de cet exemple ressemble à ceci : = T.Test(B2:B6, C2:C6,1,1)
- Appuyez sur Entrée. La cellule affichera immédiatement la valeur p. Dans notre cas, la valeur est 0,133905569 ou 13,3905569%.
Étant supérieure à 5%, cette valeur p ne fournit pas de preuves solides contre l’hypothèse nulle. Dans notre exemple, la recherche n’a pas prouvé que les régimes amaigrissants aidaient les sujets testés à perdre une quantité importante de poids. Cela ne signifie pas nécessairement que l’hypothèse nulle est correcte, seulement qu’elle n’a pas encore été réfutée.
Route d’analyse des données
L’outil d’analyse des données vous permet de faire de nombreuses choses intéressantes, y compris des calculs de valeur p. Pour simplifier les choses, nous utiliserons la même table que dans la méthode précédente.
Voici comment cela se fait.
- Puisque nous avons déjà les différences de poids dans la colonne D, nous sauterons le calcul de la différence. Pour les tableaux futurs, utilisez cette formule: = »Cellule 1″ – « Cellule 2 ».
- Ensuite, cliquez sur l’onglet Données dans le menu principal.
- Sélectionnez l’outil d’analyse des données.
- Faites défiler la liste et cliquez sur l’option t-Test: Appariement de deux échantillons pour les moyens.
- Cliquez sur OK.
- Une fenêtre contextuelle apparaîtra. Cela ressemble à ceci:
- Entrez la première plage / argument. Dans notre exemple, c’est B2:B6.
- Entrez la deuxième plage / argument. Dans ce cas, c’est C2: C6.
- Laissez la valeur par défaut dans la zone de texte Alpha (c’est 0,05).
- Cliquez sur le bouton radio Plage de sortie et choisissez où vous voulez le résultat. Si c’est la cellule A8, tapez :AA88.
- Cliquez sur OK.
- Excel calculera la valeur p et plusieurs autres paramètres. La table finale pourrait ressembler à ceci:
Comme vous pouvez le voir, la valeur p à une queue est la même que dans le premier cas – 0,133905569. Puisqu’il est au-dessus de 0.05, l’hypothèse nulle s’applique à ce tableau, et la preuve contre elle est faible.
Trouver la valeur p dans Excel 2016
Similaire aux étapes ci-dessus, couvrons le calcul de la valeur p dans Excel 2016.
- Nous utiliserons le même exemple que ci-dessus, alors créez le tableau si vous voulez suivre.
- Maintenant, dans la cellule A8, tapez = T.Test(B2:B6, C2:C6
- Ensuite, dans la cellule A8, entrez une virgule après C6, puis sélectionnez Distribution à une queue.
- Ensuite, entrez une autre virgule et sélectionnez Jumelé.
- L’équation devrait maintenant être = T. Test (B2:B6, C2: C6,1,1).
- Enfin, appuyez sur Entrée pour afficher le résultat.
Les résultats peuvent varier de quelques décimales en fonction de vos paramètres et de l’espace d’écran disponible.
Choses à savoir sur la valeur p
Voici quelques conseils utiles concernant les calculs de valeur p dans Excel.
- Si la valeur p est égale à 0,05 (5%), les données de votre table sont significatives. Si elle est inférieure à 0.05 (5%), les données dont vous disposez sont très importantes.
- Si la valeur p est supérieure à 0,1 (10%), les données de votre table sont insignifiantes. Si c’est dans la plage de 0,05 à 0,10, vous avez des données légèrement significatives.
- Vous pouvez modifier la valeur alpha, bien que les options les plus courantes soient 0,05 (5%) et 0,10 (10%).
- Choisir un test à deux queues peut être le meilleur choix, selon votre hypothèse. Dans l’exemple ci-dessus, le test à une queue signifie que nous explorons si les sujets testés ont perdu du poids après un régime, et c’est exactement ce que nous devions savoir. Mais un test à deux queues permettrait également d’examiner s’ils ont gagné des quantités de poids statistiquement significatives.
- La valeur p ne peut pas identifier les variables. En d’autres termes, s’il identifie une corrélation, il ne peut pas en identifier les causes.
La valeur p démystifiée
Tout statisticien digne de ce nom doit connaître les tenants et les aboutissants des tests d’hypothèse nulle et ce que signifie la valeur p. Ces connaissances seront également utiles aux chercheurs dans de nombreux autres domaines.