SOLUTION
検査室支援情報
精度管理の考え方
(付録) 回帰分析
回帰直線における回帰係数の検定
正規母集団から抽出した標本は限られた数であるため、母数を得られたデータから推定する必要がある。もし母標準偏差σが分かっていれば、常套手段として次の変換を行って標本標準からt分布を利用して母平均の区間推定が可能である。
・・・(20)
一般には母標準偏差σが分からないため、標本データから計算されたその不偏推定量を利用する。
回帰分析において、線形回帰を考え、0次、1次の母回帰係数をそれぞれ、として、式(3)をすでに設定した。ここに改めて示しておく。
・・・(3)
回帰式の傾きを与えるの推定値をbとして、その最尤値は式(5)で与えられた。
・・・(5)
ここで、式(5)の分子Sxyは次のように書き直すことができる。
すなわち
・・・(22)
式を簡略にするため、Biを次のように決めておくと、
・・・(23)
これによってbは(5)式から(22)式に改めて、さらに次のように簡略化できる。
・・・(24)
(24)式の意味するところは、標本データyに対してxが重みをつけていることで、たとえば典型的にXi= のときBiの分子が0になり、Biが0となるので、回帰係数bの決定にはXが平均値を取るときのデータは寄与しないことが分かる。
式(24)を使って、bの不偏推定値を求めておく。
・・・(25)
yiは母集団において、
であったから、これを使うと、式(25)は次のように書き直される。
Biの性質から
であるので、結局、
・・・(26)
Biを式(23)で定めた元の表現に戻してみる。
・・・(27)
式(27)の分子を書き直すと
ここで
だから
したがって、式(27)は、次のようになる。
・・・(28)
つまり、標本回帰係数bは母1次回帰係数の不偏推定値であることが分かる。
次いでbの分散を求める。分散を次の記号で書き表すことにすれば、
・・・(29)
分散の性質から
を利用すれば、式(29)は
yiの分散は先にσE2で与えていたので、
・・・(30)
式(30)のうち
だから、
・・・(31)
式(31)によって1次回帰係数の分散が与えられるが、ここに含まれるσE2について、母数の不偏推定値を求めなければならない。
このために、初め式(3)をもって想定した誤差εを利用することにする。
母分散の推定値は次のように定められる。
・・・(32)
だから
・・・(33)
ここで、標本回帰式を使って、yiを換えると
これを式(33)にある式に使って、
・・・(34)
式(6)でaを与えているのでこれを利用し、式(34)を書き換えると
・・・(35)
式(35)の右辺を書き換えてみる。
式の展開に当たって、簡略化のために次のように書き換えておくと、
すなわち、
・・・(36)
式(33)に戻すために式(36)の和を求める。
・・・(37)
式(37)に含まれる、次の和は0であるから
式(37)は次のように整理される。
・・・(38)
式(38)の右辺第4項に含まれる次の式の値についてさらに整理する。
・・・(39)
式(5)および(6)として線形回帰係数を与えたとき説明を省略したが、そもそもの想定として、誤差εを含む式(3)において、
・・・(40)
として、Qの最小値を与えるaおよびbをとの最尤解とした。
すなわち、 の係数bに関する変微分を0とする。
であるので
係数bに関する最尤解を求めるための設定から
式(39)が0となって、
求めようとする式(33)は次のように整理される。
・・・(41)
式(41)の期待値を求めると、
・・・(42)
式(42)の右辺第二項を元の式に戻せば、
は標本平均の分散であるから
・・・(43)
式(42)の第三項を書き直すと、
・・・(44)
V[b]は、(31)式で求めてあったので、これを使えばよい。
ところで、式(42)の右辺については
であるから
・・・(45)
そこで、(42)式全体を、式(43)、(44)、(45)でまとめると、
よって、
・・・(46)
先に式(18)において、残差平方和をの記号で求めていたので
・・・(47)
として、式(46)を改めると、
・・・(48)
y1、y2、・・・yN が正規分布をするなら、その一次式も正規分布をする。したがって、回帰係数bも正規分布をすると見なしてよい。したがって、0を見込みの数値として、式(20)を用いて、次の式によって回帰係数bの検定を行うことを考える。
ただし、式(20)にある標準偏差は、標本データを利用する際、回帰係数bの分散を与える式(31)に含まれる母分散の不偏推定値を式(48)で置き換えたものとする必要がある。すなわち、
・・・(49)
よって、回帰係数bの標準偏差は標本データを使って、次式で表すことができる。
・・・(50)
t分布をする変数は、
・・・(51)
あるいは
・・・(52)
これから
あるいは
・・・(53)
よって、回帰係数bが理論値0から著しく離れているかどうかは、t分布表で自由度N-2の値を利用し式(51)、あるいは(53)で計算される値を使って判定すればよい。通常は、0=1となるY=Xの回帰直線を期待するので式(51)あるいは(53)の0にこれを適応するとよい。ただし、左辺は正の値として絶対値を取って扱う。