SOLUTION

検査室支援情報

精度管理の考え方中 恵一

(付録) 回帰分析

回帰直線における回帰係数の検定

正規母集団から抽出した標本は限られた数であるため、母数を得られたデータから推定する必要がある。もし母標準偏差σが分かっていれば、常套手段として次の変換を行って標本標準からt分布を利用して母平均の区間推定が可能である。
 ・・・(20)

一般には母標準偏差σが分からないため、標本データから計算されたその不偏推定量を利用する。
回帰分析において、線形回帰を考え、0次、1次の母回帰係数をそれぞれとして、式(3)をすでに設定した。ここに改めて示しておく。
 ・・・(3)

回帰式の傾きを与えるの推定値をbとして、その最尤値は式(5)で与えられた。
 ・・・(5)

ここで、式(5)の分子Sxyは次のように書き直すことができる。

すなわち
 ・・・(22)

式を簡略にするため、Biを次のように決めておくと、
 ・・・(23)

これによってbは(5)式から(22)式に改めて、さらに次のように簡略化できる。
 ・・・(24)

(24)式の意味するところは、標本データyに対してxが重みをつけていることで、たとえば典型的にXi= のときBiの分子が0になり、Biが0となるので、回帰係数bの決定にはXが平均値を取るときのデータは寄与しないことが分かる。
式(24)を使って、bの不偏推定値を求めておく。
 ・・・(25)

yiは母集団において、

であったから、これを使うと、式(25)は次のように書き直される。

Biの性質から

であるので、結局、
 ・・・(26)

Biを式(23)で定めた元の表現に戻してみる。
 ・・・(27)
式(27)の分子を書き直すと

ここで

だから

したがって、式(27)は、次のようになる。
 ・・・(28)

つまり、標本回帰係数bは母1次回帰係数の不偏推定値であることが分かる。

次いでbの分散を求める。分散を次の記号で書き表すことにすれば、
 ・・・(29)
分散の性質から

を利用すれば、式(29)は

yiの分散は先にσE2で与えていたので、
 ・・・(30)
式(30)のうち

だから、
 ・・・(31)

式(31)によって1次回帰係数の分散が与えられるが、ここに含まれるσE2について、母数の不偏推定値を求めなければならない。
このために、初め式(3)をもって想定した誤差εを利用することにする。

母分散の推定値は次のように定められる。
 ・・・(32)

だから
 ・・・(33)
ここで、標本回帰式を使って、yiを換えると

これを式(33)にある式に使って、
 ・・・(34)

式(6)でaを与えているのでこれを利用し、式(34)を書き換えると
 ・・・(35)
式(35)の右辺を書き換えてみる。

式の展開に当たって、簡略化のために次のように書き換えておくと、

すなわち、


・・・(36)
式(33)に戻すために式(36)の和を求める。


・・・(37)

式(37)に含まれる、次の和は0であるから

式(37)は次のように整理される。

・・・(38)

式(38)の右辺第4項に含まれる次の式の値についてさらに整理する。
 ・・・(39)

式(5)および(6)として線形回帰係数を与えたとき説明を省略したが、そもそもの想定として、誤差εを含む式(3)において、
 ・・・(40)

として、Qの最小値を与えるaおよびbをの最尤解とした。
すなわち、 の係数bに関する変微分を0とする。

であるので
係数bに関する最尤解を求めるための設定から
式(39)が0となって、
求めようとする式(33)は次のように整理される。

 ・・・(41)
式(41)の期待値を求めると、
 ・・・(42)
式(42)の右辺第二項を元の式に戻せば、

は標本平均の分散であるから
 ・・・(43)
式(42)の第三項を書き直すと、

 ・・・(44)
V[b]は、(31)式で求めてあったので、これを使えばよい。

ところで、式(42)の右辺については

であるから
 ・・・(45)

そこで、(42)式全体を、式(43)、(44)、(45)でまとめると、

よって、
 ・・・(46)

先に式(18)において、残差平方和をの記号で求めていたので
 ・・・(47)

として、式(46)を改めると、
 ・・・(48)

y1、y2、・・・yN が正規分布をするなら、その一次式も正規分布をする。したがって、回帰係数bも正規分布をすると見なしてよい。したがって、0を見込みの数値として、式(20)を用いて、次の式によって回帰係数bの検定を行うことを考える。
ただし、式(20)にある標準偏差は、標本データを利用する際、回帰係数bの分散を与える式(31)に含まれる母分散の不偏推定値を式(48)で置き換えたものとする必要がある。すなわち、
 ・・・(49)

よって、回帰係数bの標準偏差は標本データを使って、次式で表すことができる。
 ・・・(50)

t分布をする変数は、
 ・・・(51)
あるいは
 ・・・(52)
これから

あるいは
 ・・・(53)

よって、回帰係数bが理論値0から著しく離れているかどうかは、t分布表で自由度N-2の値を利用し式(51)、あるいは(53)で計算される値を使って判定すればよい。通常は、0=1となるY=Xの回帰直線を期待するので式(51)あるいは(53)の0にこれを適応するとよい。ただし、左辺は正の値として絶対値を取って扱う。