P値とは


P値のpはprobabilityのPである。

通常、統計学有意とはP<0.05の時と仮定することが多いが、これは何を意味するのだろう?

たとえばある薬剤の発ガン性を調べる場合、統計学的検定法ではまず帰無仮説というものをたてる。

もともとの仮説は、「薬剤Aは発癌性がある」。

この場合の帰無仮説は「薬剤Aは発癌性がない」である。
観察されたデータが帰無仮説にあってる程度が5%未満であれば、極めて希なことが起こったわけでその仮説を棄却する。

つまり「薬剤Aは発癌性がある」ことが証明できたことになる。

統計では、カイ二乗検定や t 検定において、P値を計算し、0.05未満であれば、その仮説を棄却できる。

つまり、P値が0.05未満であれば、帰無仮説の正しい程度が5%未満とみなされる。

<統計の手順>

1)証明したい仮説を立てる(対立仮説)

2)それに対する帰無仮説を立てる

3)統計量を求める  (データを一つの値にまとめる)

4)統計量をもとに、P値を求める

5)P値が有意水準より大きければ帰無仮説は棄却できない(判定を保留)

  P値が有意水準より小さければ帰無仮説を棄却し、対立仮説を採用する。


P値を0.05に仮定する確かな根拠はないが一般にはP<0.05を”有意差あり”としている。P値が0.01であれば等しい確率が1%ということでさらに有意な差と考えられる。

なぜ、「差がある」という仮説で、検定しないのか? この場合には、どの程度の差があるのか仮定しないと検定できない。しかし、その差はわからないため、検定できない。そこで「差がない」という仮説を検定することになる。

実際の統計処理にあたっては、統計ソフトを使用するために手順の2)と3)の知識がなくてもなんとかなる。

統計的有意差と臨床的有意差
 ”サンプル数の決め方”の項でも解説しているが、P<0.05だったから有意差ありで何でも説明していいかというとそうではない。統計学的検定では、同じ差でもサンプル数を増やせば有意差がでることがある。ある薬物で血糖値が平均10mg/dl下がったとして、サンプル数を増やして有意差を出しても臨床的には意味のない薬ということもある。そのへんをよく考えて考察する必要がある。
 統計的解釈を行う上では、サンプル数、検出力、臨床的有意性などを考えてから結論を出すことが重要である。


有意差ありの場合には、臨床的有意性があるかどうかの検討が必要
有意差なしの場合には、症例数が充分であったかどうかの検討が必要
(有意差なしの場合に帰無仮説を採択するには、あらかじめ設定したサンプル数のデータを得ることが必要である)



有意性記号の一般的な使い方


    *:P<0.05
   **:P<0.01
  ***:P<0.001

また、折笠 秀樹氏は「臨床研究デザイン」の中で、P値の書き方について次のような点を指摘している。

1. P値のPは国際基準では、イタリックの大文字で書くことになっているが、雑誌によって規定は異なる。
2. P値を不等号で書いたり、NSと表現するより実際の値を書くことが望ましい。
3. P値の桁数は通常3桁(P=0.043など)で表すが、著しく有意の時には、P<0.0001でもよい。


しかし、最近の動向として、P値を扱う検定より推定を勧める傾向がみられる.P値からは、有意差の程度はわかるが、具体的にどの程度の差なのかがわからないからである.詳しくは、検定と推定、区間推定の項参照.


片側検定と両側検定

 片側検定と両側検定は、言葉通り片側のみを検定するか両側を検定するかということである。A群とB群の血圧を二標本 t 検定で比較する場合、どちらが高いかはわからない。よって両側検定する必要がある。しかし、高血圧の患者に降圧剤を使用する場合に有意に血圧が下がるかどうかを検定する場合には、血圧が下がることしか仮定しないのである。しかし、絶対に降圧剤で血圧が上がらないという保証はない。ほとんどの検定では両側検定が使用されている。
 実際上、片側検定と両側検定ではどう違うかというと、両側検定におけるP値0.05は、片側0.025になるが、片側検定では片側のみで0.05なので、当然片側検定の方が有意差が出やすくなる。通常は両側検定をしておけば間違いない。