análise estatística significa investigar tendências, padrões e relacionamentos usando dados quantitativos. É uma importante ferramenta de pesquisa usada por cientistas, governos, empresas e outras organizações.
para tirar conclusões válidas, a análise estatística requer um planejamento cuidadoso desde o início do processo de pesquisa. Você precisa especificar suas hipóteses e tomar decisões sobre seu projeto de pesquisa, tamanho da amostra e procedimento de amostragem.
depois de coletar dados de sua amostra, você pode organizar e resumir os dados usando estatística descritiva. Em seguida, você pode usar estatísticas inferenciais para testar formalmente hipóteses e fazer estimativas sobre a população. Finalmente, você pode interpretar e generalizar suas descobertas.
este artigo é uma introdução prática à análise estatística para estudantes e pesquisadores. Vamos orientá-lo através das etapas usando dois exemplos de pesquisa. O primeiro investiga uma potencial relação de causa e efeito, enquanto o segundo investiga uma potencial correlação entre variáveis.
para coletar dados válidos para análise estatística, primeiro você precisa especificar suas hipóteses e planejar seu projeto de pesquisa.
escrevendo hipóteses estatísticas
o objetivo da pesquisa é frequentemente investigar uma relação entre variáveis dentro de uma população. Você começa com uma previsão e usa análise estatística para testar essa previsão.
uma hipótese estatística é uma forma formal de escrever uma previsão sobre uma população. Cada previsão de pesquisa é reformulada em hipóteses nulas e alternativas que podem ser testadas usando dados de amostra.
embora a hipótese nula sempre preveja nenhum efeito ou nenhuma relação entre variáveis, a hipótese alternativa afirma sua previsão de pesquisa de um efeito ou relacionamento.
planejando seu projeto de pesquisa
um projeto de pesquisa é sua estratégia geral para coleta e análise de dados. Ele determina os testes estatísticos que você pode usar para testar sua hipótese mais tarde.
primeiro, decida se sua pesquisa usará um desenho descritivo, correlacional ou experimental. Os experimentos influenciam diretamente as variáveis, enquanto os estudos descritivos e correlacionais medem apenas as variáveis.
- em um projeto experimental, você pode avaliar uma relação de causa e efeito (por exemplo, o efeito da meditação nas pontuações dos testes) usando testes estatísticos de comparação ou regressão.
- em um design correlacional, você pode explorar as relações entre variáveis (Por exemplo, renda parental e GPA) sem qualquer suposição de causalidade usando coeficientes de correlação e testes de significância.
- Em um descritivo do projeto, pode-se estudar as características de uma população ou fenômeno (por exemplo, a prevalência de ansiedade em estudantes universitários dos EUA), usando testes estatísticos para desenhar inferências a partir da amostra de dados.
o Seu projeto de pesquisa também preocupações se você vai comparar os participantes no grupo de nível ou nível individual, ou ambos.
- em um desenho entre sujeitos, você compara os resultados em nível de grupo dos participantes que foram expostos a diferentes tratamentos (por exemplo, aqueles que realizaram um exercício de meditação versus aqueles que não fizeram).
- em um design dentro de sujeitos, você compara medidas repetidas de participantes que participaram de todos os tratamentos de um estudo (por exemplo, pontuações de antes e depois de realizar um exercício de meditação).
- Experimental
- Correlational
medindo variáveis
ao planejar um projeto de pesquisa, você deve operacionalizar suas variáveis e decidir exatamente como as medirá.
para análise estatística, é importante considerar o nível de medição de suas variáveis, que informa que tipo de dados eles contêm:
- dados categóricos representam agrupamentos. Estes podem ser nominais (por exemplo,, gênero) ou ordinal (por exemplo, nível de capacidade de linguagem).
- dados quantitativos representam quantidades. Estes podem estar em uma escala de intervalo (por exemplo, pontuação do teste) ou uma escala de proporção (por exemplo, idade).
muitas variáveis podem ser medidas em diferentes níveis de precisão. Por exemplo, os dados de idade podem ser quantitativos (8 anos) ou categóricos (jovens). Se uma variável é codificada numericamente (por exemplo, nível de concordância de 1-5), isso não significa automaticamente que é quantitativa em vez de categórica.
identificar o nível de medição é importante para escolher estatísticas apropriadas e testes de hipóteses. Por exemplo, você pode calcular uma pontuação média com dados quantitativos, mas não com dados categóricos.
em um estudo de pesquisa, juntamente com medidas de suas variáveis de interesse, você geralmente coletará dados sobre as características relevantes dos participantes.
- Experimental
- Correlational
Variável | Tipo de dados |
---|---|
Idade | Quantitativos (relação) |
Gênero | Categórica (nominal) |
Raça ou etnia | Categórica (nominal) |
teste de linha de Base escores | Quantitativa (intervalo de) |
Final pontuações do teste | Quantitativa (intervalo de) |
Variável | Tipo de dados |
---|---|
rendimentos dos pais | Quantitativos (relação) |
AGP | Quantitativa (intervalo de) |
Passo 2: Coletar dados a partir de uma amostra
Na maioria dos casos, é muito difícil ou caro para coletar dados de todos os membros da população que está interessado em estudar. Em vez disso, você coletará dados de uma amostra.
a análise estatística permite que você aplique suas descobertas além de sua própria amostra, desde que use procedimentos de amostragem apropriados. Você deve procurar uma amostra representativa da população.
amostragem para análise estatística
existem duas abordagens principais para selecionar uma amostra.
- amostragem probabilística: cada membro da população tem chance de ser selecionado para o estudo por meio de seleção aleatória.Amostragem não probabilística: alguns membros da população são mais propensos do que outros a serem selecionados para o estudo devido a critérios como conveniência ou auto-seleção voluntária.
em teoria, para resultados altamente generalizáveis, você deve usar um método de amostragem de probabilidade. A seleção aleatória reduz o viés de amostragem e garante que os dados de sua amostra sejam realmente típicos da população. Testes Paramétricos podem ser usados para fazer fortes inferências estatísticas quando os dados são coletados usando amostragem de probabilidade.
mas, na prática, raramente é possível coletar a amostra ideal. Embora as amostras sem probabilidade sejam mais propensas a serem tendenciosas, elas são muito mais fáceis de recrutar e coletar dados. Os testes não paramétricos são mais apropriados para amostras sem probabilidade, mas resultam em inferências mais fracas sobre a população.
se você quiser usar testes paramétricos para amostras sem probabilidade, você deve argumentar que:
- sua amostra é representativa da população para a qual você está generalizando suas descobertas.
- sua amostra carece de viés sistemático.
tenha em mente que a validade externa significa que você só pode generalizar suas conclusões para outras pessoas que compartilham as características de seu exemplo. Por exemplo, resultados de amostras ocidentais, educadas, industrializadas, ricas e democráticas (por exemplo,, estudantes universitários nos EUA) não são automaticamente aplicáveis a todas as populações não estranhas.
se você aplicar testes paramétricos a dados de amostras sem probabilidade, certifique-se de elaborar as limitações de quão longe seus resultados podem ser generalizados em sua seção de discussão.
crie um procedimento de amostragem apropriado
com base nos recursos disponíveis para sua pesquisa, decida como você recrutará participantes.
- você terá recursos para anunciar seu estudo amplamente, inclusive fora do ambiente universitário?
- você terá os meios para recrutar uma amostra diversificada que represente uma população ampla?
- você tem tempo para entrar em contato e acompanhar os membros de grupos de difícil acesso?
- Experimental
- Correlational
Calcule o tamanho da amostra suficiente
Antes de recrutar participantes, decida o tamanho da amostra Olhando para outros estudos em seu campo ou usando estatísticas. Uma amostra muito pequena pode não ser representativa da amostra, enquanto uma amostra muito grande será mais cara do que o necessário.
existem muitas calculadoras de tamanho de amostra online. Diferentes fórmulas são usadas dependendo se você tem subgrupos ou quão rigoroso seu estudo deve ser (por exemplo, em pesquisa clínica). Como regra geral, é necessário um mínimo de 30 unidades ou mais por subgrupo.
para usar essas calculadoras, você precisa entender e inserir esses componentes-chave:
- nível de significância (alfa): o risco de rejeitar uma verdadeira hipótese nula que você está disposto a assumir, geralmente definida em 5%.
- poder estatístico: a probabilidade de seu estudo detectar um efeito de um determinado tamanho se houver um, geralmente 80% ou mais.
- tamanho esperado do efeito: uma indicação padronizada de quão grande será o resultado esperado do seu estudo, geralmente com base em outros estudos semelhantes.
- desvio padrão populacional: uma estimativa do parâmetro populacional com base em um estudo anterior ou em um estudo piloto próprio.
Passo 3: faça um resumo de seus dados com a estatística descritiva
Depois de recolhidos todos os dados, você pode inspecioná-los e calcular estatísticas descritivas que resumi-los.
inspecione seus dados
existem várias maneiras de inspecionar seus dados, incluindo o seguinte:
- organizando dados de cada variável em tabelas de distribuição de frequência.
- exibindo dados de uma variável-chave em um gráfico de barras para visualizar a distribuição das respostas.
- visualizando a relação entre duas variáveis usando um gráfico de dispersão.
ao visualizar seus dados em tabelas e gráficos, você pode avaliar se seus dados seguem uma distribuição distorcida ou normal e se há outliers ou dados ausentes.
uma distribuição normal significa que seus dados são simetricamente distribuídos em torno de um centro onde a maioria dos valores se encontram, com os valores diminuindo nas extremidades da cauda.
Em contraste, uma distribuição desigual é assimétrico e tem mais valores em uma extremidade do que o outro. A forma da distribuição é importante ter em mente porque apenas algumas estatísticas descritivas devem ser usadas com distribuições Distorcidas.
outliers extremos também podem produzir estatísticas enganosas, então você pode precisar de uma abordagem sistemática para lidar com esses valores.
calcular medidas de tendência central
medidas de tendência central descrevem onde a maioria dos valores em um conjunto de dados está. Três medidas principais de tendência central são frequentemente relatadas:
- modo: a resposta ou valor mais popular no conjunto de dados.
- mediana: o valor no meio exato do conjunto de dados quando ordenado de baixo para alto.
- média: a soma de todos os valores divididos pelo número de valores.
no entanto, dependendo da forma da distribuição e do nível de medição, apenas uma ou duas dessas medidas podem ser apropriadas. Por exemplo, muitas características demográficas só podem ser descritas usando o modo ou proporções, enquanto uma variável como o tempo de reação pode não ter um modo.
calcular medidas de variabilidade
as medidas de variabilidade informam como são distribuídos os valores em um conjunto de dados. Quatro medidas principais de variabilidade são frequentemente relatadas:
- intervalo: o valor mais alto menos o valor mais baixo do conjunto de dados.
- intervalo interquartil: o intervalo da metade média do conjunto de dados.
- desvio padrão: a distância média entre cada valor em seu conjunto de dados e a média.Variância: o quadrado do desvio padrão.
mais uma vez, a forma da distribuição e o nível de medição devem orientar sua escolha de estatísticas de variabilidade. A faixa interquartil é a melhor medida para distribuições Distorcidas, enquanto o desvio padrão e a variância fornecem as melhores informações para distribuições normais.
- Experimental
- correlacional
usando sua tabela, você deve verificar se as unidades da estatística descritiva são comparáveis para as pontuações pré-teste e pós-teste. Por exemplo, os níveis de variância são semelhantes entre os grupos? Existem valores extremos? Se houver, talvez seja necessário identificar e remover outliers extremos em seu conjunto de dados ou transformar seus dados antes de realizar um teste estatístico.
Pré-teste escores | pós-teste pontuações | |
---|---|---|
Média | 68.44 | 75.25 |
desvio Padrão | 9.43 | 9.88 |
Variância | 88.96 | 97.96 |
Gama | 36.25 | 45.12 |
N | 30 |
A partir desta tabela, podemos ver que a média de pontuação aumentada após o exercício de meditação, e as variâncias das duas pontuações são comparáveis. Em seguida, podemos realizar um teste estatístico para descobrir se essa melhora nos escores dos testes é estatisticamente significativa na população.
é importante verificar se você tem uma ampla gama de pontos de dados. Se você não fizer isso, seus dados podem ser distorcidos em relação a alguns grupos mais do que outros (por exemplo, grandes empreendedores acadêmicos), e apenas inferências limitadas podem ser feitas sobre um relacionamento.
rendimento Parental (USD) | AGP | |
---|---|---|
Média | 62,100 | 3.12 |
desvio Padrão | 15,000 | 0.45 |
Variância | 225,000,000 | 0.16 |
Gama | 8,000–378,000 | 2.64–4.00 |
N | 653 |
ao lado, podemos calcular um coeficiente de correlação e de efectuar um teste estatístico para compreender o significado da relação entre as variáveis na população.
Passo 4: Teste hipóteses ou Faça estimativas com estatísticas inferenciais
um número que descreve uma amostra é chamado de estatística, enquanto um número que descreve uma população é chamado de parâmetro. Usando estatísticas inferenciais, você pode tirar conclusões sobre parâmetros populacionais com base em estatísticas de amostra.
os pesquisadores costumam usar dois métodos principais (simultaneamente) para fazer inferências nas estatísticas.
- estimativa: cálculo dos parâmetros populacionais com base nas estatísticas da amostra.
- teste de hipóteses: um processo formal para testar previsões de pesquisa sobre a população usando amostras.
Estimativa de
Você pode fazer dois tipos de estimativas de parâmetros populacionais a partir de amostras estatísticas:
- Um ponto de estimativa: é um valor que representa a melhor estimativa do parâmetro exato.
- uma estimativa de intervalo: um intervalo de valores que representam seu melhor palpite de onde está o parâmetro.
se o seu objetivo é inferir e relatar as características da população a partir dos dados da amostra, é melhor usar estimativas de ponto e intervalo em seu artigo.
você pode considerar uma estatística de amostra uma estimativa pontual para o parâmetro população quando você tem uma amostra representativa (por exemplo, em uma ampla pesquisa de opinião pública, a proporção de uma amostra que apóia o governo atual é tomada como a proporção populacional de apoiadores do governo).
há sempre um erro envolvido na estimativa, portanto, você também deve fornecer um intervalo de confiança como uma estimativa de intervalo para mostrar a variabilidade em torno de uma estimativa pontual.
um intervalo de confiança usa o erro padrão e a pontuação z da distribuição normal padrão para transmitir onde você geralmente esperaria encontrar o parâmetro de população na maioria das vezes.
teste de hipóteses
usando dados de uma amostra, você pode testar hipóteses sobre relações entre variáveis na população. O teste de hipóteses começa com a suposição de que a hipótese nula é verdadeira na população, e você usa testes estatísticos para avaliar se a hipótese nula pode ser rejeitada ou não.
os testes estatísticos determinam onde os dados da amostra estariam em uma distribuição esperada dos dados da amostra se a hipótese nula fosse verdadeira. Esses testes fornecem duas saídas principais:
- uma estatística de teste informa o quanto seus dados diferem da hipótese nula do teste.
- um valor p informa a probabilidade de obter seus resultados se a hipótese nula for realmente verdadeira na população.
os testes estatísticos vêm em três variedades principais:
- os testes de comparação avaliam as diferenças de grupo nos resultados.
- os testes de regressão avaliam as relações de causa e efeito entre as variáveis.
- os testes de correlação avaliam as relações entre variáveis sem assumir causalidade.
sua escolha de teste estatístico depende de suas questões de pesquisa, projeto de pesquisa, método de amostragem e características dos dados.
Testes Paramétricos
Testes Paramétricos fazem inferências poderosas sobre a população com base nos dados da amostra. Mas para usá-los, algumas suposições devem ser atendidas e apenas alguns tipos de variáveis podem ser usados. Se seus dados violarem essas suposições, você poderá realizar transformações de dados apropriadas ou usar testes não paramétricos alternativos.
uma regressão modela até que ponto as mudanças em uma variável preditora resultam em mudanças na(s) variável (s) de resultado.
- uma regressão linear simples inclui uma variável preditora e uma variável de resultado.
- uma regressão linear múltipla inclui duas ou mais variáveis preditoras e uma variável de resultado.
testes de comparação geralmente comparam as médias dos grupos. Estas podem ser as médias de diferentes grupos dentro de uma amostra (por exemplo, um grupo de tratamento e controle), as médias de um grupo de amostra coletado em momentos diferentes (por exemplo, escores pré-teste e pós-teste) ou uma média de amostra e uma média populacional.
- um teste t é para exatamente 1 ou 2 grupos quando a amostra é pequena (30 ou menos).
- um teste z é para exatamente 1 ou 2 grupos quando a amostra é grande.
- ANOVA é para 3 ou mais grupos.
os testes z e t têm subtipos com base no número e nos tipos de amostras e nas hipóteses:
- se você tiver apenas uma amostra que deseja comparar com uma média populacional, use um teste de uma amostra.
- se você tiver medições emparelhadas( design dentro dos sujeitos), use um teste de amostras dependente (emparelhado).
- se você tiver medições completamente separadas de dois grupos incomparáveis( design entre sujeitos), use um teste de amostras independente.
- se você espera uma diferença entre os grupos em uma direção específica, use um teste de cauda única.
- se você não tem nenhuma expectativa para a direção de uma diferença entre os grupos, use um teste de duas caudas.
o único teste de correlação paramétrica é o R de Pearson. o coeficiente de correlação (r) informa a força de uma relação linear entre duas variáveis quantitativas.
no Entanto, para testar se a correlação na amostra é forte o suficiente para ser importante na população, você também precisa realizar um teste de significância do coeficiente de correlação, geralmente, um teste t, para obter um valor de p. Este teste usa o tamanho da amostra para calcular o quanto o coeficiente de correlação difere de zero na população.
- Experimental
- Correlational
Passo 5: Interprete seus resultados
a etapa final da análise estatística é interpretar seus resultados.
significância estatística
no teste de hipóteses, a significância estatística é o principal critério para a formação de conclusões. Você compara seu valor p a um nível de significância definido (geralmente 0,05) para decidir se seus resultados são estatisticamente significativos ou não significativos.
os resultados estatisticamente significativos são considerados improváveis de terem surgido apenas devido ao acaso. Existe apenas uma chance muito baixa de tal resultado ocorrer se a hipótese nula for verdadeira na população.
- Experimental
- Correlational
Efeito do tamanho
Um resultado estatisticamente significativo, não significa necessariamente que há importantes aplicações da vida real ou resultados clínicos para uma constatação.
em contraste, o tamanho do efeito indica o significado prático de seus resultados. É importante relatar tamanhos de efeito junto com suas estatísticas inferenciais para obter uma imagem completa de seus resultados. Você também deve relatar estimativas de intervalo de tamanhos de efeito se estiver escrevendo um artigo no estilo APA.
- Experimental
- Correlational
erros de decisão
os erros Tipo I e tipo II são erros cometidos nas conclusões da pesquisa. Um erro Tipo I significa rejeitar a hipótese nula quando é realmente verdadeira, enquanto um erro Tipo II significa não rejeitar a hipótese nula quando é falsa.
você pode tentar minimizar o risco desses erros selecionando um nível de significância ideal e garantindo alta potência. No entanto, há uma compensação entre os dois erros, portanto, um bom saldo é necessário.
Estatísticas Frequentistas versus Bayesianas
tradicionalmente, as estatísticas frequentistas enfatizam o teste de significância de hipótese nula e sempre começam com a suposição de uma verdadeira hipótese nula.
no entanto, as estatísticas Bayesianas cresceram em popularidade como uma abordagem alternativa nas últimas décadas. Nesta abordagem, você usa pesquisas anteriores para atualizar continuamente suas hipóteses com base em suas expectativas e observações.
Bayes factor compara a força relativa da evidência para o nulo versus a hipótese alternativa em vez de fazer uma conclusão sobre rejeitar a hipótese nula ou não.
Perguntas frequentes sobre análise estatística
a análise estatística é o principal método para analisar dados quantitativos de pesquisa. Ele usa probabilidades e modelos para testar previsões sobre uma população a partir de dados de amostra.
as estatísticas descritivas resumem as características de um conjunto de dados. As estatísticas inferenciais permitem testar uma hipótese ou avaliar se seus dados são generalizáveis para a população em geral.
o teste de hipóteses é um procedimento formal para investigar nossas idéias sobre o mundo usando estatísticas. É usado por cientistas para testar previsões específicas, chamadas hipóteses, calculando a probabilidade de que um padrão ou relação entre variáveis possa ter surgido por acaso.
no teste de hipóteses estatísticas, a hipótese nula de um teste sempre prevê nenhum efeito ou nenhuma relação entre variáveis, enquanto a hipótese alternativa afirma sua previsão de pesquisa de um efeito ou relacionamento.
a significância estatística é arbitrária-depende do limiar, ou valor alfa, escolhido pelo pesquisador. O limite mais comum é p < 0,05, o que significa que os dados provavelmente ocorrerão menos de 5% do tempo sob a hipótese nula.
quando o valor p cai abaixo do valor alfa escolhido, então dizemos que o resultado do teste é estatisticamente significativo.