Cómo calcular el valor p en Excel

La teoría detrás de los valores p y la hipótesis nula puede parecer complicada al principio, pero comprender los conceptos lo ayudará a navegar por el mundo de las estadísticas. Desafortunadamente, estos términos a menudo se usan mal en la ciencia popular, por lo que sería útil para todos comprender los conceptos básicos.

Calcular el valor p de un modelo y probar/refutar la hipótesis nula es sorprendentemente simple con MS Excel. Hay dos maneras de hacerlo y cubriremos las dos. Vamos a cavar.

Hipótesis nula y Valor p

La hipótesis nula es una declaración, también conocida como posición predeterminada, que afirma que la relación entre los fenómenos observados es inexistente. También se puede aplicar a asociaciones entre dos grupos observados. Durante la investigación, usted prueba esta hipótesis y trata de refutarla.

Por ejemplo, supongamos que desea observar si una dieta de moda en particular tiene resultados significativos. La hipótesis nula, en este caso, es que no hay diferencia significativa en el peso de los sujetos de prueba antes y después de la dieta. La hipótesis alternativa es que la dieta hizo una diferencia. Esto es lo que los investigadores intentarían probar.

El valor p representa la posibilidad de que el resumen estadístico sea igual o mayor que el valor observado cuando la hipótesis nula es verdadera para un modelo estadístico determinado. Aunque a menudo se expresa como un número decimal, generalmente es mejor expresarlo como un porcentaje. Por ejemplo, el valor de p de 0,1 debe representarse como 10%.

Un valor p bajo significa que la evidencia contra la hipótesis nula es fuerte. Esto significa además que sus datos son significativos. Por otro lado, un valor de p alto significa que no hay evidencia sólida contra la hipótesis. Para probar que la dieta de moda funciona, los investigadores tendrían que encontrar un valor p bajo.

Un resultado estadísticamente significativo es el que es muy poco probable que ocurra si la hipótesis nula es verdadera. El nivel de significancia se denota con la letra griega alfa y tiene que ser mayor que el valor p para que el resultado sea estadísticamente significativo.

Muchos investigadores en una amplia gama de campos utilizan el valor p para obtener una visión mejor y más profunda de los datos con los que están trabajando. Algunos de los campos destacados incluyen la sociología, la justicia penal, la psicología, las finanzas y la economía.

Encontrar el valor p en Excel 2010

Puede encontrar el valor p de un conjunto de datos en MS Excel a través de la función T-Test o utilizando la herramienta de análisis de datos. Primero, veremos la función T-Test. Examinaremos a cinco estudiantes universitarios que hicieron una dieta de 30 días. Compararemos su peso antes y después de la dieta.

NOTA: A los efectos de este artículo, lo dividiremos en MS Excel 2010 y 2016. Aunque los pasos deben aplicarse generalmente a todas las versiones, el diseño de los menús y demás será diferente.

Función de prueba T

Siga estos pasos para calcular el valor p con la función de prueba T.

Crear y rellenar la tabla. Nuestra mesa se ve así:
Haz clic en cualquier celda fuera de la mesa.
Escriba: = T. Test(.
Después del corchete abierto, escriba el primer argumento. En este ejemplo, es la columna Antes de la dieta. El rango debe ser B2: B6. Hasta ahora, la función se ve así: T. Test(B2:B6.
A continuación, introduciremos el segundo argumento. La columna Después de la Dieta y sus resultados son nuestro segundo argumento y el rango que necesitamos es C2: C6. Añadámoslo a la fórmula: T. Test (B2: B6, C2: C6.
Escriba una coma después del segundo argumento y las opciones de distribución de una cola y distribución de dos colas aparecerán automáticamente en un menú desplegable. Vamos a elegir la primera distribución de una cola. Haz doble clic en él.
Escribe otra coma.
Haga doble clic en la opción Emparejado en el siguiente menú desplegable.
Ahora que tiene todos los elementos que necesita, cierre el soporte. La fórmula para este ejemplo se ve así :=T. Test(B2:B6,C2: C6,1,1)
Pulse Intro. La celda mostrará el valor p inmediatamente. En nuestro caso, el valor es 0.133905569 o 13.3905569%.

Al ser superior al 5%, este valor de p no proporciona pruebas sólidas contra la hipótesis nula. En nuestro ejemplo, la investigación no demostró que la dieta ayudara a los sujetos de prueba a perder una cantidad significativa de peso. Esto no significa necesariamente que la hipótesis nula sea correcta, solo que aún no ha sido refutada.

Ruta de análisis de datos

La herramienta de análisis de datos le permite hacer muchas cosas interesantes, incluidos cálculos de valor p. Para simplificar las cosas, usaremos la misma tabla que en el método anterior.

Así es como se hace.

Dado que ya tenemos las diferencias de peso en la columna D, omitiremos el cálculo de la diferencia. Para las tablas futuras, use esta fórmula: = «Celda 1» – «Celda 2».
A continuación, haga clic en la pestaña Datos en el menú principal.
Seleccione la herramienta de Análisis de datos.
Desplácese hacia abajo por la lista y haga clic en la opción t-Test: Emparejado de dos muestras para medios.
Haga clic en Aceptar.
Aparecerá una ventana emergente. Se parece a esto:
Introduzca el primer rango/argumento. En nuestro ejemplo, es B2: B6.
Introduzca el segundo rango / argumento. En este caso, es C2: C6.
Deje el valor predeterminado en el cuadro de texto Alfa (es 0.05).
Haga clic en el botón de opción Rango de salida y elija dónde desea obtener el resultado. Si es la celda A8, escriba :A A 8 8.
Haga clic en Aceptar.
Excel calculará el valor p y varios otros parámetros. La mesa final podría verse así:

Como puede ver, el valor p de una cola es el mismo que en el primer caso: 0.133905569. Ya que está por encima de 0.05, la hipótesis nula se aplica a esta tabla, y la evidencia en su contra es débil.

Encontrar el valor p en Excel 2016

Similar a los pasos anteriores, cubramos el cálculo del valor p en Excel 2016.

Usaremos el mismo ejemplo que el anterior, así que cree la tabla si desea seguirla.
Ahora, en la celda A8, escriba =T. Test(B2: B6, C2: C6
A continuación, en la celda A8, ingrese una coma después de C6 y luego seleccione Distribución de una cola.
A continuación, introduzca otra coma y seleccione Emparejado.
La ecuación ahora debería ser =T. Test(B2:B6, C2:C6,1,1).
Finalmente, presione Entrar para mostrar el resultado.

Los resultados pueden variar en unos pocos decimales, dependiendo de la configuración y el espacio de pantalla disponible.

Cosas que debe saber Sobre el valor p

Aquí hay algunos consejos útiles con respecto a los cálculos de valor p en Excel.

Si el valor de p es igual a 0,05 (5%), los datos de la tabla son significativos. Si es menor que 0.05 (5%), los datos que tiene son altamente significativos.
En caso de que el valor de p sea superior a 0,1 (10%), los datos de la tabla son insignificantes. Si está en el rango de 0.05-0.10, tiene datos marginalmente significativos.
Puede cambiar el valor alfa, aunque las opciones más comunes son 0.05 (5%) y 0.10 (10%).
Elegir pruebas de dos colas puede ser la mejor opción, dependiendo de su hipótesis. En el ejemplo anterior, la prueba de una sola cola significa que exploramos si los sujetos de prueba perdieron peso después de hacer dieta, y eso es exactamente lo que necesitábamos averiguar. Pero una prueba de dos colas también examinaría si ganaron cantidades estadísticamente significativas de peso.
El valor p no puede identificar variables. En otras palabras, si identifica una correlación, no puede identificar las causas detrás de ella.

El Valor p Desmitificado

Todo estadístico que valga la pena debe conocer los entresijos de la prueba de hipótesis nula y lo que significa el valor p. Este conocimiento también será útil para los investigadores en muchos otros campos.