統計分析とは、定量的データを使用して傾向、パターン、および関係を調査することを意味します。 これは、科学者、政府、企業、およびその他の組織によって使用される重要な研究ツールです。
有効な結論を引き出すためには、統計分析は研究プロセスの最初から慎重な計画を立てる必要があります。 仮説を指定し、研究設計、サンプルサイズ、およびサンプリング手順について決定する必要があります。
サンプルからデータを収集した後、記述統計を使用してデータを整理および要約することができます。 次に、推論統計を使用して仮説を正式に検定し、母集団に関する推定を行うことができます。 最後に、結果を解釈して一般化することができます。
この記事は、学生や研究者のための統計分析の実用的な紹介です。 私たちは、二つの研究例を使用して手順を順を追って説明します。 最初は潜在的な因果関係を調査し、2番目は変数間の潜在的な相関関係を調査します。
ステップ1:仮説を書き、研究デザインを計画する
統計分析のための有効なデータを収集するには、まず仮説を指定し、研究デザインを計画する必要があります。
統計的仮説を書く
研究の目標は、母集団内の変数間の関係を調査することが多い。 予測から始めて、統計分析を使用してその予測をテストします。
統計的仮説は、母集団についての予測を書く形式的な方法です。 すべての研究予測は、サンプルデータを使用してテストすることができる帰無仮説と対立仮説に言い換えられます。
帰無仮説は常に変数間の効果や関係を予測しませんが、対立仮説は効果や関係の研究予測を述べています。
研究デザインの計画
研究デザインは、データ収集と分析のための全体的な戦略です。 これにより、後で仮説を検定するために使用できる統計的検定が決定されます。
まず、あなたの研究が記述的、相関的、または実験的な計画を使用するかどうかを決定します。 実験は変数に直接影響を与えますが、記述的および相関的な研究では変数のみを測定します。
- 実験計画では、比較または回帰の統計的検定を使用して、因果関係(テストスコアに対する瞑想の効果など)を評価できます。
- 相関計画では、変数間の関係を調べることができます(例: 相関係数と有意性検定を用いて因果関係を仮定することなく、親の収入とGPA)。
- 記述計画では、統計的検定を使用して母集団または現象の特性(米国の大学生の不安の有病率など)を研究し、サンプルデータから推論を引き出すこ
あなたの研究デザインは、グループレベルで参加者を比較するのか、個人レベルで参加者を比較するのか、またはその両方にも関係しています。
- 被験者間のデザインでは、異なる治療法に曝された参加者(瞑想運動を行った参加者としなかった参加者)のグループレベルの結果を比較します。
- 被験者内デザインでは、研究のすべての治療に参加した参加者からの反復測定(瞑想運動の前後のスコアなど)を比較します。
- 実験
- 相関
変数の測定
研究設計を計画するときは、変数を操作し、それらをどのように測定するかを正確に決定する必要があります。
統計分析のためには、変数がどのような種類のデータを含んでいるかを示す変数の測定レベルを考慮することが重要です:
- カテゴリデータはグループ化を表します。 これらは公称値である可能性があります(例: 性別)または序数(例えば、言語能力のレベル)。
- 定量データは量を表します。 これらは、間隔スケール(例えば、テストスコア)または比率スケール(例えば、年齢)であってもよい。
さまざまなレベルの精度で多くの変数を測定できます。 例えば、年齢データは、定量的(8歳)または分類的(若い)であり得る。 変数が数値的にコード化されている場合(例えば、1-5からの一致のレベル)、それは自動的にそれがカテゴリカルではなく定量的であることを意味するものではありません。
適切な統計と仮説検定を選択するためには、測定レベルを特定することが重要です。 たとえば、定量的データを使用して平均スコアを計算できますが、カテゴリデータを使用しては計算できません。
調査研究では、関心のある変数の尺度とともに、関連する参加者の特性に関するデータを収集することがよくあります。
- 実験
- 相関
変数 | データの型 |
---|---|
年齢 | ) |
性別 | カテゴリ(公称)) |
人種または民族 | カテゴリ(公称) |
ベースラインテストのスコア | 定量的(間隔) |
最終テストスコア | 定量的(間隔) |
変数 | データの型 |
---|---|
親の収入 | 定量的(比率)) |
GPA | 定量的(間隔) |
ステップ2: サンプルからデータを収集する
ほとんどの場合、学習に関心のある母集団のすべてのメンバーからデータを収集するのは難しすぎたり高価すぎたりします。 代わりに、サンプルからデータを収集します。
統計分析では、適切なサンプリング手順を使用する限り、自分のサンプルを超えて調査結果を適用することができます。 母集団を代表するサンプルを目指す必要があります。
統計分析のためのサンプリング
サンプルを選択するには、主に二つのアプローチがあります。
- 確率サンプリング:母集団のすべてのメンバーは、ランダム選択を通じて研究のために選択される可能性があります。
- 非確率サンプリング:人口の一部のメンバーは、利便性や自発的な自己選択などの基準のために、他のメンバーよりも研究のために選択される可能性が
理論的には、高度に一般化可能な結果を得るには、確率サンプリング法を使用する必要があります。 ランダム選択は、サンプリングバイアスを低減し、あなたのサンプルからのデータが実際に母集団の典型的であることを保証します。 パラメトリック検定は、確率サンプリングを使用してデータを収集するときに、強力な統計的推論を行うために使用できます。
しかし、実際には、理想的なサンプルを収集することはめったにありません。 非確率サンプルは偏っている可能性が高くなりますが、データを募集して収集する方がはるかに簡単です。 ノンパラメトリック検定は、非確率サンプルに適していますが、母集団についての推論は弱くなります。
非確率サンプルに対してパラメトリック検定を使用する場合は、次のようなケースを作成する必要があります:
- あなたのサンプルは、あなたがあなたの調査結果を一般化している母集団を代表しています。
- あなたのサンプルは体系的なバイアスを欠いています。
外部妥当性とは、サンプルの特性を共有する他の人にのみ結論を一般化できることを意味することに注意してください。 例えば、西洋の、教育を受けた、工業化された、豊かで民主的なサンプルからの結果(例えば、米国の大学生)は、すべての非奇妙な集団に自動的に適用されるわけではありません。
非確率サンプルのデータにパラメトリック検定を適用する場合は、議論のセクションで結果を一般化できる範囲の制限について詳しく説明してく
適切なサンプリング手順を作成する
あなたの研究のために利用可能なリソースに基づいて、参加者を募集する方法を決定します。
- あなたの大学の設定の外を含め、広くあなたの研究を宣伝するためのリソースを持っていますか?
- 幅広い人口を表す多様なサンプルを募集する手段はありますか?
- 手が届きにくいグループのメンバーと連絡を取り、フォローアップする時間はありますか?
- 実験
- 相関
十分なサンプルサイズの計算
参加者を募集する前に、自分の分野の他の研究を見るか、統計を使用してサンプルサイズを決定してください。 大きすぎるサンプルは、必要以上に高価になりますが、小さすぎるサンプルは、サンプルの代表ではないかもしれません。
オンラインには多くのサンプルサイズの計算機があります。 サブグループがあるかどうか、または研究がどの程度厳密であるべきか(臨床研究など)に応じて、さまざまな式が使用されます。 経験則として、サブグループあたり最低30単位以上が必要です。
これらの電卓を使用するには、これらの主要なコンポーネントを理解し、入力する必要があります:
- 有意水準(アルファ):あなたが取ることを喜んでいる真の帰無仮説を拒否するリスク、通常は5%に設定されています。
- 統計的検出力:あるサイズの効果がある場合、通常は80%以上の効果を検出する確率。
- 期待される効果サイズ: あなたの研究の期待される結果は、通常、他の同様の研究に基づいて、どのくらいの大きさの標準化された指標になります。
- 母集団標準偏差:以前の研究または独自のパイロット研究に基づく母集団パラメータの推定値。
ステップ3:記述統計を使用してデータを要約する
すべてのデータを収集したら、それらを検査して要約する記述統計を計算することができます。
データを検査する
データを検査するには、次のようなさまざまな方法があります:
- 頻度分布表の各変数からのデータを整理します。
- キー変数のデータを棒グラフに表示して、応答の分布を表示します。
- 散布図を使用して2つの変数間の関係を視覚化します。
データを表やグラフで視覚化することで、データが歪んだ分布または正規分布に従うかどうか、外れ値または欠損データがあるかどうかを評価できます。
正規分布とは、データがほとんどの値が存在する中心の周りに対称的に分布し、値が末尾で先細りになることを意味します。
対照的に、歪んだ分布は非対称であり、一方の端には他方の端よりも多くの値があります。 分布の形状は、歪んだ分布で使用する必要がある記述統計量の一部だけに注意する必要があるため、注意することが重要です。
極端な外れ値も誤解を招く統計を生成する可能性があるため、これらの値を処理するための体系的なアプローチが必要な場合があります。
中心傾向の測定値を計算
中心傾向の測定値は、データセット内のほとんどの値がどこにあるかを記述します。 中心傾向の三つの主要な尺度がしばしば報告されている:
- モード:データセット内で最も一般的な応答または値。
- : 低から高に順序付けされたときのデータセットの正確な中央の値。
- Mean:すべての値の合計を値の数で割った値。
しかし、分布の形状や測定レベルによっては、これらの測定のうちの一つまたは二つだけが適切である場合があります。 例えば、多くの人口統計学的特性は、モードまたは比率を使用してのみ記述することができ、反応時間のような変数はモードを全く持たない場合がある。
変動性の測定値を計算
変動性の測定値は、データセット内の値がどのように広がっているかを示します。 変動の四つの主要な尺度は、多くの場合、報告されています:
- 範囲:最大値からデータセットの最小値を引いた値。
- 四分位範囲:データセットの中央半分の範囲。
- 標準偏差:データセット内の各値と平均値との間の平均距離。
- 分散:標準偏差の二乗。
もう一度、分布の形状と測定レベルは、変動統計の選択をガイドする必要があります。 四分位間の範囲は歪んだ分布の最良の尺度であり、標準偏差と分散は正規分布の最良の情報を提供します。
- 実験
- 相関
テーブルを使用して、記述統計量の単位がテスト前とテスト後のスコアに匹敵するかどうかを確認する必要があります。 たとえば、分散レベルはグループ間で類似していますか? 極端な値はありますか? 存在する場合は、統計的検定を実行する前に、データセット内の極端な外れ値を特定して削除するか、データを変換する必要がある場合があります。
テスト前のスコア | テスト後のスコア | |
---|---|---|
平均 | 68.44 | 75.25 |
標準偏差 | 9.43 | 9.88 |
分散 | 88.96 | 97.96 |
範囲 | 36.25 | 45.12 |
N | 30 |
この表から、瞑想の練習後に平均スコアが増加し、2つのスコアの分散が同等であることがわかります。 次に、テストスコアのこの改善が母集団で統計的に有意であるかどうかを調べるために統計的検定を実行することができます。
広い範囲のデータポイントがあるかどうかを確認することが重要です。 そうしないと、データは他のグループ(例えば、高い学業成績者)よりもいくつかのグループに偏っている可能性があり、関係については限られた推論しか行
親の収入(米ドル) | GPA | |
---|---|---|
平均 | 62,100 | 3.12 |
標準偏差 | 15,000 | 0.45 |
分散 | 225,000,000 | 0.16 |
範囲 | 8,000–378,000 | 2.64–4.00 |
N | 653 |
次に、相関係数を計算し、統計的検定を実行して、母集団内の変数間の関係の有意性を理解することができます。
ステップ4: 仮説の検定または推論統計による推定
サンプルを記述する数値は統計と呼ばれ、母集団を記述する数値はパラメータと呼ばれます。 推論統計量を使用すると、標本統計量に基づいて母集団パラメーターについて結論を出すことができます。
研究者は、統計の推論を行うために2つの主要な方法を(同時に)使用することがよくあります。
- 推定:サンプル統計に基づいて母集団パラメータを計算します。
- : サンプルを使用して人口についての研究の予測をテストするための正式なプロセス。
推定
サンプル統計から母集団パラメータの二種類の推定を行うことができます:
- ポイント推定値:正確なパラメータの最良の推測を表す値。
- 区間推定値:パラメータがどこにあるかの最良の推測を表す値の範囲。
サンプルデータから母集団の特性を推測して報告することを目的とする場合は、論文で点と間隔の両方の推定値を使用することをお勧めします。
サンプル統計は、代表的なサンプルがある場合(例えば、幅広い世論調査では、現在の政府を支持するサンプルの割合は、政府支持者の人口割合とします)、人口パラメータのポイント推定値と考えることができます。
推定には常に誤差が含まれているため、ポイント推定値の周りの変動性を示すために、信頼区間を区間推定値として提供する必要があります。
信頼区間では、標準誤差と標準正規分布のzスコアを使用して、通常、ほとんどの場合、母集団パラメータを見つけると予想される場所を伝えます。
仮説検定
サンプルのデータを使用して、母集団の変数間の関係に関する仮説を検定できます。 仮説検定は、帰無仮説が母集団で真であるという仮定から始まり、帰無仮説を棄却できるかどうかを評価するために統計的検定を使用します。
統計的検定は、帰無仮説が真である場合に、サンプルデータが期待されるサンプルデータの分布のどこにあるかを決定します。 これらのテストは2つの主要な出力を与えます:
- 検定統計量は、検定の帰無仮説とデータがどの程度異なるかを示します。
- p値は、帰無仮説が母集団で実際に真である場合に結果を得る可能性を示します。
:
- 比較テストは、結果のグループの違いを評価します。
- 回帰テストは、変数間の因果関係を評価します。
- 相関検定は、因果関係を仮定せずに変数間の関係を評価します。
統計検定の選択は、研究の質問、研究設計、サンプリング方法、およびデータ特性によって異なります。
パラメトリック検定
パラメトリック検定は、サンプルデータに基づいて母集団に関する強力な推論を行います。 しかし、それらを使用するには、いくつかの仮定を満たさなければならず、いくつかのタイプの変数のみを使用することができます。 データがこれらの仮定に違反している場合は、適切なデータ変換を実行するか、代わりに代替のノンパラメトリック検定を使用できます。
回帰は、予測子変数の変化が結果変数の変化をもたらす程度をモデル化します。
- 単純な線形回帰には、1つの予測子変数と1つの結果変数が含まれます。
- 多重線形回帰には、2つ以上の予測子変数と1つの結果変数が含まれます。
比較テストは、通常、グループの平均を比較します。 これらは、試料内の異なる群の平均(例えば、治療群および対照群)、異なる時間に採取された1つの試料群の平均(例えば、検査前および検査後のスコア)、ま
- t検定は、サンプルが小さい(30以下)ときに正確に1または2グループを対象とします。
- z検定は、サンプルが大きい場合、正確に1または2グループに対する検定です。
- ANOVAは3つ以上のグループに対して使用されます。
z検定とt検定には、サンプルの数とタイプ、および仮説に基づくサブタイプがあります:母集団平均と比較したい標本が1つしかない場合は、1標本検定を使用します。
唯一のパラメトリック相関検定はピアソンのrです。相関係数(r)は、2つの量的変数間の線形関係の強さを示します。
ただし、標本の相関が母集団で重要であるほど十分に強いかどうかを検定するには、相関係数の有意性検定、通常はt検定を実行してp値を取得す この検定では、標本サイズを使用して、相関係数が母集団のゼロとどの程度異なるかを計算します。
- 実験
- 相関
ステップ5: あなたの結果を解釈する
統計分析の最後のステップは、あなたの結果を解釈することです。
統計的有意性
仮説検定では、統計的有意性が結論を形成するための主な基準です。 P値を設定された有意水準(通常は0.05)と比較して、結果が統計的に有意であるか非有意であるかを判断します。
統計的に有意な結果は、偶然だけが原因で発生する可能性は低いと考えられています。 帰無仮説が母集団で真である場合、このような結果が発生する可能性は非常に低いだけです。
- 実験
- 相関
効果サイズ
統計的に有意な結果は、必ずしも重要な実生活への応用や臨床転帰があることを意味するものではありません。
対照的に、効果の大きさは結果の実際的な有意性を示します。 結果の全体像を把握するためには、推定統計とともに効果サイズを報告することが重要です。 APAスタイルの論文を書いている場合は、効果サイズの間隔推定値も報告する必要があります。
- 実験
- 相関
意思決定エラー
タイプIおよびタイプIIのエラーは、研究結論で行われた間違いです。 タイプIエラーは、実際に真であるときに帰無仮説を拒否することを意味し、タイプIIエラーは、偽であるときに帰無仮説を拒否しないことを意味します。
最適な有意水準を選択し、高いパワーを確保することで、これらのエラーのリスクを最小限に抑えることを目指すことができます。 しかし、二つのエラーの間にはトレードオフがあるので、細かいバランスが必要です。
頻度統計対ベイズ統計
伝統的に、頻度統計は帰無仮説の有意性検定を重視し、常に真の帰無仮説の仮定から始まります。
しかし、ベイズ統計はここ数十年で代替アプローチとして人気が高まっています。 このアプローチでは、あなたは継続的にあなたの期待と観察に基づいて、あなたの仮説を更新するために、以前の研究を使用しています。
ベイズ因子は、帰無仮説を棄却するか否かについての結論を出すのではなく、帰無仮説に対する証拠の相対的強さと対立仮説を比較する。
統計分析に関するよくある質問
統計分析は、定量的な研究データを分析するための主な方法です。 確率とモデルを使用して、サンプルデータから母集団に関する予測をテストします。
記述統計は、データセットの特性を要約します。 推論統計を使用すると、仮説を検定したり、データがより広範な母集団に対して一般化可能であるかどうかを評価したりできます。
仮説検定は、統計を用いて世界についての私たちの考えを調査するための正式な手順です。 これは、変数間のパターンまたは関係が偶然に発生した可能性がある可能性を計算することによって、仮説と呼ばれる特定の予測をテストするために科学者によって使用されます。
統計的仮説検定では、検定の帰無仮説は常に変数間の効果または関係を予測しませんが、対立仮説は効果または関係の研究予測を示します。
統計的有意性は、統計的検定の帰無仮説の下で観測が行われた可能性は低いと研究者が述べるために使用する用語です。 有意性は、通常、p値、または確率値によって示されます。
統計的有意性は任意であり、研究者が選択した閾値またはアルファ値に依存する。 最も一般的なしきい値はp<0.05であり、これは帰無仮説の下でデータが5%未満の時間に発生する可能性が高いことを意味します。
p値が選択したアルファ値を下回った場合、検定の結果は統計的に有意であると言います。