SOLUTION

検査室支援情報

精度管理の考え方中 恵一

Q3 Answer

Q.3

同じ標本群ではないが、同じ条件を満足している2つの別々の標本群があって、それらを対象にデータを得たとき、2つの標本群を得た母集団の平均に差があるかどうかを検討したい。一般的な方法としてはどのような方法がありますか?(兵庫県 K.S.様)

A.3

互いに独立した(無関連な)2組の標本が得られたとき、もとになった2つの母集団の平均が等しいと言えるかどうかを検定する。
母集団と得られた標本の関係、および標本の分布については次のように考える。
母集団 → 標本 → 標本変量 → 標本分布(標本平均・標本分散)
2つの標本は互いに独立な母集団から得られたものと仮定する。もし、2つの標本が独立でない場合には、「対応のある2群の検定」を適応し、平均値の差の検定は、Studentのt-検定を用いる。

母集団の分布が正規分布で、母分散は未知の場合

互いに独立な2つの標本を、次のようにする。

  • x 1 , x 2 , ... , xNx:標本数 Nx
  • y 1 , y 2 , ... , yNy:標本数 Ny

この標本を得た2組の母集団は、正規分布であることが分かっているものとし、2つの母集団に関する分散σx2 と σy2 は共に未知であるものとする。
まず、2つの母集団の分散について等しいかどうかを検定する必要がある。
分散が等しい場合には後出の(1)の方法を、等分散性でない、すなわちバラツキが等しくない、2つの分布平均を比較するには違った検定法(後出の(2)の方法)を用いる。

2つの母集団の等分散についての検定

母分散は未知であるので標本分散を求め、これから母分散の不偏分散推定値を得てその等分散性を検定する。

検定手順

前提:
帰無仮説H0:σx2= σy2
対立仮説H1:σx2≠ σy2
有意水準α=0.05で両側検定を行う
F値の計算
記号を次のようにする。
母分散の不偏分散推定値:ux2, uy2
標本分散:sx2, sy2

式(1)・・・式(1)

手計算では、F>1となるように標本から計算されるsx2と sy2を選び、F表から2.5%点を読みとる(検定の前提は有意水準α=0.05であるが、2つの群の分散を比にするときF≧qのときも、F≦qの場合もあるので、検定はα/2として有意水準2.5%をとる)。このときの自由度は、fx=Nx-1, fy=Ny-1である。

【参考】エクセル関数:finv(p, df1, df2) は、第1自由度df1、第2自由度df2、でF分布における上側確率がpとなるときのF値を計算する。また、エクセル関数:fdist(F,df1, df2) は、同様に第1自由度df1、第2自由度df2、でF分布における値Fの上側確率、すなわち与えられたF値より大きくなるときの確率を計算する。

定義したα/2を上側確率として、F分布におけるパーセント点を計算し、このパーセント点に比較して式(1)で計算された値が小さいときは、帰無仮説を採択し、2つの母分散には有意な差がないと判定する。逆に、式(1)で計算された値が大きいときは、帰無仮説を棄却し、2つの母分散には有意な差があると判定する。あるいは、式(1)で計算された値をF分布におけるパーセント点とし、F分布においてこの値より大きくなる確率を計算し、これが定義したα/2より小さいときには、めったにそんなことが起きないと考え帰無仮説を棄却する。

【例】fx=Nx-1= fy=Ny-1=19で、式(1)の値が1.90であったとき、エクセル関数:finv(0.025, 19, 19)=2.526と計算され、上側確率が2.5%(p=0.025)になるときのF値が2.526であり、2.526>1.90であるので帰無仮説を採択する。または、もう一つのエクセル関数: fdist(1.90, 19, 19)=0.0855から、F分布において1.90より大きい場合の確率は、8.6%である。これは2.5%より小さいと言えないので帰無仮説を採択することになり、同じ結果となって「2つの母分散は等しい」と判定する。

2つの母平均の差に対する検定

(1) 2つの母集団に対する母分散が等しいと仮定できるか、あるいは、2つの母集団の等分散についての検定によって帰無仮説が採択されたとき、母平均の差に関するStudent t-検定を行う。

検定手順

前提:
帰無仮説H0: 2つの群の母平均には差がない
対立仮説H1: 2つの群の母平均には差がある
有意水準α=0.05で両側検定を行う
各統計量の計算
記号を次のようにする。
2つの標本平均: 
2つの群を合わせた不偏分散推定値: ue2,
式(2)・・・式(2)
検定統計量t0を求める。
式(3)・・・式(3)
式(2)(3)に標本分散sx2, sy2を用いると、
式(4)・・・式(4)

したがって、

式(4)'

そこで、式(3)は次のようになる。

式(5)・・・式(5)

t0は自由度f=Nx+Ny-2のt-分布に従う。

有意確率をP = Pr{|t|≧ t0}とする。
t 分布表,または t 分布に関するエクセル関数を使う。

【参考】エクセル関数:tdist(t, df, flag) は、自由度dfでt-分布において、tより大きくなる片側確率(flag=1)あるいは絶対値がtより大きくなる両側確率(flag=2)を計算する。また、エクセル関数:tinv(p, df)は、自由度dfでt-分布における両側確率がpであるときのパーセント点を計算する。P0= tdist(t0, df, 2)のとき、t0= tinv( P0, df)の関係になる。また、tdist(t, df, 1)=2x tdist(t, df, 2)の関係がある。

式(5)によって計算された値t0をt-分布におけるパーセント点とし、この値より大きくなる両側確率pを計算する。これが定義したα(=0.05)より小さいときには、めったにそんなことが起きないと考え帰無仮説を棄却する。
帰無仮説の採否を決める。
p>α のとき,帰無仮説を採択する。「2 群の母平均値に差があるとはいえない」。
p≦α のとき,帰無仮説を棄却する。「2 群の母平均値に差がある」。

例題では,有意水準 5% で検定を行うとすれば(α = 0.05),P < α であるから,帰無仮説を棄却する。すなわち,「母平均値に差がある」。

(2) 2つの母集団に対する母分散が等しいと仮定できないか、あるいは、2つの母集団の等分散についての検定によって帰無仮説が棄却されたとき、母平均の差に関するWelch-検定を行う。
t-検定を用いて必ずしも母分散が等しいと前提できない2つの母平均について有意な差があることを検定するのは正しくない。これに代わる方法として、Cochran-Coxの方法、Welchの方法や、Welch-Aspinの方法などがあるが、比較的誤差の少ないWelch-検定を用いる。

検定に用いる統計量t'の計算
記号を次のようにする。
2つの標本平均: 
母分散の不偏分散推定値:ux2, uy2
標本分散:sx2, sy2
式(6)・・・式(6)
この統計量t'は、正確にt-分布に従わない。t-分布への近似は次の式による自由度を用いる。
まず、中間計算値cを求め、次いで、自由度νを計算する。
式(7)・・・式(7)
式(8)・・・式(8)

この式(8)によって得た自由度νに対するt-分布における両側確率αを与えるパーセント点を次に求めるが自由度νは一般に整数値にはならない。そこで、νの小数点以下を切り捨てた整数値をνLOWとしてこの自由度に対するパーセント点tLOWを得る。式(6)によって計算された値t0をtLOWと比較する。
このとき、t0>tLOWならば、帰無仮説を棄却する。
さらに、この式(8)によって得た自由度νの小数点以下を切り上げた整数値をνUPPERとしてこの自由度に対するパーセント点tUPPERを得る。
このとき、tUPPER>t0ならば、帰無仮説を採択する。
tLOW>t0>tUPPERならば補間法によってtmを求める。
たとえば、自由度νがν=19.2のとき、tm=0.2×t19+0.8×t20とすればよい。こうして求めたt-分布における両側確率αを与えるパーセント点が
t0≧tmならば、帰無仮説を棄却、tm>t0ならば、帰無仮説を採択する。
結果として次のように判定する。
帰無仮説を採択したときは、「2 群の母平均値に差があるとはいえない」。
帰無仮説を棄却したときは、「2 群の母平均値に差がある」。

-補足-
Welch-検定の解説では、用いた母分散σ2の推定量である、母分散の不偏分散推定値u2を標本分散s2で表記していない。すでにそれまでの記述で、それが明らかであろうと考えたからである。しかし、標本分散で計算するように記述してある前半部と統一に欠けるので以下の通り式(6)以降を書き改めておく。

標本分布と母数との関係から記号を改めて書き出しておく。
1つの標本を Ox: x1,x2,………xN とし、標本の大きさをNx とする。残る標本群は添え文字をyで表記する他は同じ。

xの母平均:μx
yの母平均:μyただし、E{ } は期待値を示す記号
xの標本平均:
yの標本平均:
xの標本変動:Sx :
yの標本変動:Sy :
xの標本分散: sx2 :
yの標本分散: sy2 :
xの母分散の不偏分散推定値: ux2
yの母分散の不偏分散推定値: uy2
xの母分散: σx2 : E{ux2} =σx2
yの母分散: σy2 : E{uy2} =σy2

Welch-検定に用いる統計量t'の計算
・・・式(6')
この統計量t'は、正確にt-分布に従わない。t-分布への近似は次の式による自由度を用いる。
まず、中間計算値cを求め、次いで、自由度νを計算する。
<・・・式(7')
・・・式(8)

以下は本文に戻る。

篠倉 潔
(NTT西日本大阪病院 臨床検査科)
2003年8月15日