a teoria por trás dos valores p e da hipótese nula pode parecer complicada no início, mas entender os conceitos o ajudará a navegar pelo mundo das estatísticas. Infelizmente, esses termos são frequentemente mal utilizados na ciência popular, por isso seria útil para todos entenderem o básico.
Calcular o valor p de um modelo e provando/rejeita-se a hipótese nula é surpreendentemente simples com o MS Excel. Existem duas maneiras de fazer isso e vamos cobrir os dois. Vamos entrar.
hipótese nula e valor p
a hipótese nula é uma afirmação, também referida como posição padrão, que afirma que a relação entre os fenômenos observados é inexistente. Também pode ser aplicado a associações entre dois grupos observados. Durante a pesquisa, você testa essa hipótese e tenta refutá-la.
por exemplo, digamos que você queira observar se uma determinada dieta da moda tem resultados significativos. A hipótese nula, neste caso, é que não há diferença significativa no peso dos sujeitos do teste antes e depois da dieta. A hipótese alternativa é que a dieta fez a diferença. Isso é o que os pesquisadores tentariam provar.
o valor p representa a chance de que o resumo estatístico seja igual ou maior que o valor observado quando a hipótese nula for verdadeira para um determinado modelo estatístico. Embora seja frequentemente expresso como um número decimal, geralmente é melhor expressá-lo como uma porcentagem. Por exemplo, o valor p de 0,1 deve ser representado como 10%.
um valor p baixo significa que a evidência contra a hipótese nula é forte. Isso significa ainda que seus dados são significativos. Por outro lado, um alto valor p significa que não há evidências fortes contra a hipótese. Para provar que a dieta da moda funciona, os pesquisadores precisariam encontrar um baixo valor p.
um resultado estatisticamente significativo é aquele que é altamente improvável que aconteça se a hipótese nula for verdadeira. O nível de significância é denotado com a letra grega alfa e tem que ser maior do que o valor p para que o resultado seja estatisticamente significativo.
muitos pesquisadores em uma ampla gama de campos usam o valor p para obter uma visão melhor e mais profunda dos dados com os quais estão trabalhando. Alguns dos Campos proeminentes incluem Sociologia, justiça criminal, psicologia, finanças e economia.
encontrar o valor p no Excel 2010
você pode encontrar o valor p de um conjunto de dados no MS Excel por meio da função T-Test ou usando a Ferramenta de Análise de dados. Primeiro, vamos olhar para a função t-Test. Examinaremos cinco estudantes universitários que fizeram uma dieta de 30 dias. Vamos comparar seu peso antes e depois da dieta.
nota: para os fins deste artigo, vamos dividi-lo em MS Excel 2010 e 2016. Embora as etapas geralmente devam se aplicar a todas as versões, o layout dos menus e outros enfeites serão diferentes.
função t-Test
siga estas etapas para calcular o valor p com a função t-Test.
- crie e preencha a tabela. Nossa mesa se parece com isso:
- clique em qualquer célula fora da sua mesa.
- digite: = T. teste(.
- após o colchete aberto, digite o primeiro argumento. Neste exemplo, é a coluna antes da dieta. O intervalo deve ser B2: B6. Até agora, a função se parece com isso: T. Test(B2:B6.
- em seguida, entraremos no segundo argumento. A coluna after Diet e seus resultados são nosso segundo argumento e o intervalo de que precisamos é C2:C6. Vamos adicioná-lo à fórmula: T. teste(B2:B6,C2:C6.
- digite uma vírgula após o segundo argumento e as opções de distribuição de uma cauda e distribuição de duas caudas aparecerão automaticamente em um menu suspenso. Vamos escolher a primeira distribuição de uma cauda. Clique duas vezes nele.
- digite outra vírgula.
- clique duas vezes na opção emparelhada no próximo menu suspenso.
- agora que você tem todos os elementos que você precisa, feche o suporte. A fórmula para este exemplo é assim: = T. Test(B2:B6,C2: C6,1,1)
- pressione Enter. A célula exibirá o valor p imediatamente. No nosso caso, o valor é 0,133905569 ou 13,3905569%.
sendo superior a 5%, esse valor p não fornece fortes evidências contra a hipótese nula. Em nosso exemplo, a pesquisa não provou que a dieta ajudou os sujeitos do teste a perder uma quantidade significativa de peso. Isso não significa necessariamente que a hipótese nula está correta, apenas que ainda não foi refutada.
rota de Análise de dados
a ferramenta de Análise de dados permite que você faça muitas coisas legais, incluindo cálculos de valor p. Para tornar as coisas mais simples, usaremos a mesma tabela do método anterior.
é assim que é feito.
- como já temos as diferenças de peso na coluna D, pularemos o cálculo da diferença. Para as tabelas futuras, use esta fórmula: = “célula 1” – “célula 2”.
- em seguida, clique na guia Dados no menu principal.
- selecione a ferramenta de Análise de dados.
- Role a lista para baixo e clique na opção T-Test: emparelhado dois amostra para meios.
- clique em OK.
- uma janela pop-up aparecerá. Parece que isso:
- digite o primeiro intervalo / argumento. Em nosso exemplo, é B2: B6.
- digite o segundo intervalo / argumento. Neste caso, é C2:C6.
- deixe o valor padrão na caixa de texto alfa (é 0,05).
- clique no botão de opção Faixa de saída e escolha onde deseja o resultado. Se for a célula A8, digite: $a $ 8.
- clique em OK.
- o Excel calculará o valor p e vários outros parâmetros. A tabela final pode ser assim:
como você pode ver, o valor p de uma cauda é o mesmo que no primeiro caso-0,133905569. Uma vez que está acima de 0.05, a hipótese nula se aplica a esta tabela, e a evidência contra ela é fraca.
encontrar o valor p no Excel 2016
semelhante às etapas acima, vamos cobrir o cálculo do valor p no Excel 2016.
- usaremos o mesmo exemplo acima, portanto, crie a tabela se quiser acompanhar.
- Agora, na Célula A8, digite =T. Teste(B2:B6 C2:C6
- em seguida, na Célula A8, introduza uma vírgula depois de C6 e, em seguida, selecione Uma cauda de distribuição.
- em seguida, insira outra vírgula e selecione emparelhado.
- a equação deve agora ser = T. teste(B2:B6, C2:C6,1,1).
- finalmente, pressione Enter para mostrar o resultado.
os resultados podem variar em algumas casas decimais, dependendo das configurações e do espaço disponível na tela.
coisas para saber sobre o valor p
Aqui estão algumas dicas úteis sobre cálculos de valor p no Excel.
- se o valor p for igual a 0,05( 5%), os dados em sua tabela são significativos. Se for menor que 0.05 (5%), os dados que você tem são altamente significativos.
- caso o valor p seja superior a 0,1( 10%), os dados da sua tabela são insignificantes. Se estiver na faixa de 0,05-0,10, você tem dados marginalmente significativos.
- você pode alterar o valor alfa, embora as opções mais comuns sejam 0,05 (5%) e 0,10 (10%).
- escolher o teste bicaudal pode ser a melhor escolha, dependendo da sua hipótese. No exemplo acima, o teste de cauda única significa que exploramos se os sujeitos do teste perderam peso após a dieta, e é exatamente isso que precisávamos descobrir. Mas um teste de duas caudas também examinaria se eles ganharam quantidades estatisticamente significativas de peso.
- o valor p não consegue identificar variáveis. Em outras palavras, se identifica uma correlação, não consegue identificar as causas por trás dela.
o valor-p desmistificado
todo estatístico que vale seu sal deve conhecer os meandros do teste de hipótese nula e o que o valor-p significa. Esse conhecimento também será útil para pesquisadores em muitos outros campos.