p値と帰無仮説の背後にある理論は、最初は複雑に見えるかもしれませんが、概念を理解することは、統計の世界をナビゲート 残念ながら、これらの用語は一般的な科学で誤用されることが多いので、誰もが基本を理解することは有用です。
モデルのp値を計算し、帰無仮説を証明/反証することは、MS Excelで驚くほど簡単です。 そこにそれを行うには二つの方法があり、我々はそれらの両方をカバーします。 掘り下げてみよう
帰無仮説とp値
帰無仮説は、観測された現象の間の関係が存在しないことを主張するデフォルト位置とも呼ばれるステートメントです。 また、二つの観察されたグループ間の関連付けに適用することができます。 研究中に、あなたはこの仮説をテストし、それを反証しようとします。
たとえば、特定の流行の食事に有意な結果があるかどうかを観察したいとします。 帰無仮説は、この場合、食事療法の前後に被験者の体重に有意差がないということである。 対立仮説は食事療法が違いを生じたことである。 これは研究者が証明しようとするものです。
p値は、帰無仮説が特定の統計モデルに対して真である場合に、統計的要約が観測値以上になる可能性を表します。p値は、帰無仮説が真である場合に、統計的要約が観測値以上になる可能性を表します。 それはしばしば10進数として表現されますが、一般的にはパーセンテージとして表現する方が良いです。 たとえば、0.1のp値は10%として表す必要があります。
p値が低いとは、帰無仮説に対する証拠が強いことを意味します。 これはさらに、あなたのデータが重要であることを意味します。 一方、高いp値は、仮説に対する強力な証拠がないことを意味します。 流行の食事療法が働くことを証明するためには、研究者は低いp価値を見つける必要があります。
統計的に有意な結果は、帰無仮説が真である場合に発生する可能性が非常に低い結果です。 有意水準はギリシャ文字alphaで示され、結果が統計的に有意であるためにはp値よりも大きくなければなりません。
幅広い分野の多くの研究者が、p値を使用して、作業しているデータをより深く洞察することができます。 著名な分野には、社会学、刑事司法、心理学、金融、経済学などがあります。
Excel2010
でのp値の検索MS Excelでは、t検定関数またはデータ分析ツールを使用して、データセットのp値を見つけることができます。 まず、T検定関数を調べます。 私たちは、30日間の食事に行った五大学生を調べます。 私たちは、食事の前と後に自分の体重を比較します。
注:この記事の目的のために、MS Excel2010と2016に分割します。 手順は、一般的にすべてのバージョンに適用する必要がありますが、メニューのレイアウトとその他もろもろは異なります。
T検定関数
T検定関数を使用してp値を計算するには、次の手順に従います。
- テーブルを作成して移入します。 私たちのテーブルは次のようになります:
- 表の外側のセルをクリックします。
- 入力:=T.Test(.
- 開いた角かっこの後に、最初の引数を入力します。 この例では、食事前の列です。 範囲はB2:B6にする必要があります。 これまでのところ、関数は次のようになります。T.Test(B2:B6.
- 次に、2番目の引数を入力します。 After Diet列とその結果は2番目の引数であり、必要な範囲はC2:C6です。 それを式に追加しましょう:T.Test(B2:B6、C2:C6。
- 2番目の引数の後にカンマを入力すると、片側分布と両側分布のオプションが自動的にドロップダウンメニューに表示されます。 最初の片側分布を選んでみましょう。 それをダブルクリックします。
- 別のカンマを入力します。
- 次のドロップダウンメニューでペアリングされたオプションをダブルクリックします。
- 必要なすべての要素が揃ったので、ブラケットを閉じます。 この例の式は次のようになります。=T.Test(B2:B6,C2:C6,1,1)
- Enterキーを押します。 セルにはp値がすぐに表示されます。 私たちの場合、値は0.133905569または13.3905569%です。
5%よりも高いため、このp値は帰無仮説に対する強力な証拠を提供しません。 私たちの例では、研究はダイエットが被験者がかなりの量の体重を失うのを助けたことを証明していませんでした。 これは必ずしも帰無仮説が正しいことを意味するものではなく、まだ反証されていないということだけです。
データ解析ルート
データ解析ツールを使用すると、p値の計算を含む多くのクールなことを行うことができます。 物事を簡単にするために、我々は前の方法と同じテーブルを使用します。
ここではそれが行われている方法です。
- D列に重みの違いが既にあるため、差分の計算はスキップします。 将来のテーブルでは、次の式を使用します。=”セル1″-“セル2″。
- 次に、メインメニューのデータタブをクリックします。
- データ分析ツールを選択します。
- リストを下にスクロールし、T検定:平均のペアリングされた2つのサンプルオプションをクリックします。
- [OK]をクリックします。
- ポップアップウィンドウが表示されます。 これは次のようになります:
- 最初の範囲/引数を入力します。 この例では、B2:B6です。
- 2番目の範囲/引数を入力します。 この場合、それはC2:C6です。
- アルファテキストボックスにデフォルト値のままにしておきます(0.05です)。
- 出力範囲ラジオボタンをクリックして、結果が必要な場所を選択します。 A8セルの場合は、$A$8と入力します。
- [OK]をクリックします。
- Excelはp値と他のいくつかのパラメータを計算します。 最後の表は次のようになります:
ご覧のとおり、1尾のp値は最初のケースと同じです-0.133905569。 それは0以上ですので。05では、帰無仮説がこの表に適用され、それに対する証拠は弱いです。
Excel2016でのp値の検索
上記の手順と同様に、Excel2016でのp値の計算について説明します。
- 上記と同じ例を使用しますので、フォローしたい場合はテーブルを作成してください。 ここで、セルA8に=Tと入力します。Test(B2:B6,C2:C6
- 次に、セルA8で、c6の後にカンマを入力し、片側分布を選択します。
- 次に、別のカンマを入力し、ペアリングを選択します。
- 式は=T.Test(B2:B6,C2:C6,1,1)になります。
- 最後に、Enterキーを押して結果を表示します。
結果は、設定と使用可能な画面スペースに応じて、小数点以下の桁数によって異なる場合があります。
P値について知っておくべきこと
ここでは、Excelでのp値の計算に関するいくつかの有用なヒントがあります。
- p値が0.05(5%)に等しい場合、テーブル内のデータは有意です。 それが0未満の場合。05(5%)、あなたが持っているデータは非常に重要です。
- p値が0.1(10%)を超える場合、テーブル内のデータは重要ではありません。 それが0.05-0.10の範囲にある場合、わずかに重要なデータがあります。
- アルファ値は変更できますが、最も一般的なオプションは0.05(5%)と0.10(10%)です。
- 仮説に応じて、両側検定を選択する方が良い選択です。 上記の例では、片側のテストは、被験者がダイエット後に体重を失ったかどうかを調べることを意味し、それはまさに私たちが見つけるために必要 しかし、両側検定では、統計的に有意な量の体重が得られたかどうかも調べられます。
- p値は変数を識別できません。 言い換えれば、相関関係を特定する場合、その背後にある原因を特定することはできません。
P値は
彼または彼女の塩の価値があるすべての統計学者は、帰無仮説検定のインとアウトとp値が何を意味するかを知っている必要があります。 この知識は、他の多くの分野の研究者にも役立ちます。