χ2検定とMcNemar検定(マクネマー検定)

 

 2x2分割表については、比率の差、相対危険度、オッズ比とその95%信頼区間について別項で説明した。ここでは、検定法について説明する。

1)χ2独立性の検定: Chi-square test for independence

2x2分割表の検定に用いられる。

例:出生体重1000g未満の児に予防的にグルコースーインスリン療法(GI療法)を施行した群としなかった群での、高カリウム血症発生数を比較し、GI療法により発生率が異なるかをみる。

GI療法施行
GI療法施行せず
高K血症(+)
8
20
高K血症(-)
23
6


この場合各セルの期待度数がすべて5以上ならχ2検定を行う。
もし、5以下のセルがある場合にはFishreの直接確率計算法を行う。

期待度数とは

x1
x2
y1
a
c
y2
b
d


aの期待度数=(a+b)×(a+c)/(a+b+c+d)

Stat Viewでは、期待度数の計算も可能.

χ2検定かFisher検定かについて、Harvey Motulskyは次のようにまとめて
いる。

○Fisher's Exact検定は、常に正確なp値を与えるために最良の選択である。
○χ2検定は計算が簡単であるが、近似的なp値しか与えない。
○コンピューターに計算させる場合 Fisher検定を用いるべきである。
○分割表の数値が6未満の数値が一つでもあればχ2検定は絶対に
 避けるべきである。
○サンプルサイズが大きい場合Yatesの補正は必要ない。


独立性の検定(χ2検定)と2群の比率の差の検定

 両者とも2x2分割表の検定に用いられるが独立性の検定の帰無仮説は「2変数は関連がない」であるのに対し2群の比率の差の検定の帰無仮説は「2群の比率に差はない」である。
 両者の検定結果は全く同じであるが、2群の比率の差の検定は最初に2群を設定した後にデータを収集する場合に用いられるのに対し、独立性の検定は前もって対象数を決めておいてから後に2要因に分類した場合に用いられる。

 

以下の例のような、A国とB国の乳児の寝るときの体位の比が同じかどうかをみるには、同等性の検定(χ2検定と同じ)をおこなう.

うつ伏せ寝
仰向け寝
一定せず
A国
33%
30%
37%
B国
28%
35%
37%

しかし、2群において、著効、やや有効、不変、悪化など順位をつけた場合にはMann-Whitney 検定 (Wilcoxon rank sum test)を用いる。ちなみに、4群を有効と無効に分類してしまうと、χ2検定となる。

著効
やや有効
不変
悪化
A群
3
5
6
7
B群
4
5
3
2



2)McNemar検定

2群の比率の差の検定でも対応がある場合にはMcMemar検定を用いる。
例1)同じ100人で大統領を支持するかどうかを前期と後期で調査し差があったかどうかを調べる場合。

前期
後期
支持
非支持
支持
20
25
45
非支持
35
20
55
55
45
100
例2) 2人の病理医が同一の標本をみて、その評価に違いがでるかどうかを調べる場合

病理医A
病理医B
正常
異常
正常
a
b
m1
異常
c
d
m2
n1
n2
N
これを、χ2検定する場合の2x2分割表は次のようになるが正しくはない。

病理医
診断結果
正常
異常
m1
m2
N
n1
n2
N
n1+m1
n2+m2
2N
例3)乳幼児突然死症候群(SIDS)の危険因子の研究において、SIDSで死亡した症例とマッチさせた対照を選んで検討したとする。この場合対照は同じ地域で同じ頃出生した同性の児であったとする。例えば普段仰向け寝であったかそうでなかったかで違いがあるかをみる場合、単にχ2検定をするよりもマッチングさせた事を取り入れた検定法の方が望ましい。こういった場合にもMcNemar検定が用いられる。

SIDS
1
1
0
1
0
・・・・
1
対照
0
1
0
0
1
・・・・
0
0:うつ伏せ寝以外、1:うつ伏せ寝

対照
SIDS
うつ伏せ寝
うつ伏せ寝以外
うつ伏せ寝
a
b
m1
うつ伏せ寝以外
c
d
m2
n1
n2
N

McNemar検定は、次の式でχ2値を求めれば簡単にできる。

上の式で-1はYatesの連続補正であるが省略してもよい。

自由度1のχ2分布からp値を求める。

例1では((35−25)ー1)2/(35+25)=1.35

1.35は自由度1のχ2分布でみるとp値が0.2367〜0.2542である。

ただし、b+cが10以下の場合には2項分布にもとずくexact検定を用いる。

SPSSでは、b+cが25未満の場合には二項分布を用いる。

SPSSによるMcNemar検定法はこちら

なおオッズ比はb/cで、その95%信頼区間は

多分類の場合

ところで、SIDSの危険因子で、母乳、混合、人工乳の場合のように多分類の場合にはどのように処理したらよいだろう。

母乳
混合
人工乳
母乳
n11
n12
n13
混合
n21
n22
n23
人工乳
n31
n32
n33
この場合には、母乳とその他、混合とその他、人工乳とその他の3種類の表ができそれぞれについてMcNemar検定を行えばよい。ただし、多重検定が問題となるため検定統計量の自由度は分類数-1(=2)つまり自由度2のχ2分布を参考にする。

母乳
その他
母乳
n11
n12+n13
その他
n21+n31
n22+n23+n32+n33
同様にあと2つの表ができる。