一方向分散分析(”分散分析”)は、対応する母集団平均の間に統計的に有意な差があるかどうかを判断するために、三つ以上の独立したグループの平均を比較します。

このチュートリアルでは、一方向分散分析を手動で実行する方法について説明します。

例:手による一方向のANOVA

3つの異なる試験準備プログラムが特定の試験で異なる平均スコアにつながるかどうかを知りたいとします。 これをテストするために、我々は研究に参加する30人の学生を募集し、三つのグループに分割します。

各グループの学生は、試験の準備のために次の三週間のための三つの試験準備プログラムのいずれかを使用するようにランダムに割り当てられます。 三週間の終わりに、すべての学生が同じ試験を受けます。

各グループの試験成績を以下に示します:

一元ANOVAデータの例

次の手順を使用して、一元ANOVAを手動で実行して、試験の平均スコアが3つのグループ間で異なるかどうかを判断します。

ステップ1: グループ平均と全体平均を計算します。

まず、3つのグループすべての平均と全体の平均を計算します:

ステップ2:SSRを計算します。

次に、次の式を使用して回帰二乗和(SSR)を計算します。

n≤(Xj–X。.2

:

  • n:グループj
  • のサンプルサイズΘ:”合計”を意味するギリシャの記号
  • Xj:グループj
  • Xの平均。.:この例では、全体の平均

は、SSRを計算します= 10(83.4-85.8)2 + 10(89.3-85.8)2 + 10(84.7-85.8)2 = 192.2

ステップ3:SSEを計算します。次に、次の式を使用して誤差二乗和(SSE)を計算します。

√(Xij–Xj)2

ここで、:

  • Λ:「合計」を意味するギリシャ記号
  • Xij:グループjのi番目の観測
  • Xj:グループjの平均

この例では、SSEを次のように計算します。

Group1: (85-83.4)2 + (86-83.4)2 + (88-83.4)2 + (75-83.4)2 + (78-83.4)2 + (94-83.4)2 + (98-83.4)2 + (79-83.4)2 + (71-83.4)2 + (80-83.4)2 = 640.4

グループ2: (91-89.3)2 + (92-89.3)2 + (93-89.3)2 + (85-89.3)2 + (87-89.3)2 + (84-89.3)2 + (82-89.3)2 + (88-89.3)2 + (95-89.3)2 + (96-89.3)2 = 208.1

グループ3: (79-84.7)2 + (78-84.7)2 + (88-84.7)2 + (94-84.7)2 + (92-84.7)2 + (85-84.7)2 + (83-84.7)2 + (85-84.7)2 + (82-84.7)2 + (81-84.7)2 = 252.1

SSE: 640.4 + 208.1 + 252.1 = 1100.6

ステップ4:SSTを計算します。

次に、次の式を使用して二乗合計(SST)を計算します。

SST=SSR+SSE

この例では、SST= 192.2 + 1100.6 = 1292.8

ステップ5: ANOVA表に入力します。SSR、SSE、およびSSTが得られたので、ANOVAテーブルを入力できます:

ソース 平方和(SS) df 平均平方(MS) F
治療 192.2 2 96.1 2.358
エラー 1100.6 27 40.8
合計 1292.8 29

ここでは、テーブル内のさまざまな数字を計算する方法です:

  • df治療:k-1 = 3-1 = 2
  • dfエラー:n-k= 30-3 = 27
  • df合計:n-1 = 30-1 = 29
  • MSの処置:SST/dfの処置= 192.2 / 2 = 96.1
  • MSエラー:SSE/dfエラー= 1100.6 / 27 = 40.8
  • F:MSの処置/MSの間違い= 96.1 / 40.8 = 2.358

注:n=合計観測値、k=グループの数

ステップ6:結果を解釈します。

この一元化ANOVAのF検定統計量は2.358です。 これが統計的に有意な結果であるかどうかを判断するには、これをF分布表にあるF臨界値と次の値と比較する必要があります:

  • α(有意水準)=0.05
  • DF1(分子の自由度)=df処理=2
  • DF2(分母の自由度)=df誤差= 27

F臨界値は3.3541であることがわかります。

ANOVA表のF検定統計量がF分布表のf臨界値より小さいため、帰無仮説を棄却することはできません。 これは、3つのグループの平均試験スコアの間に統計的に有意な差があると言うのに十分な証拠がないことを意味します。

コメントを残す

メールアドレスが公開されることはありません。