SOLUTION
検査室支援情報
精度管理の考え方
(付録) 回帰分析
母集団全体におけるyの平均E(y)
YがXによって説明されると考える場合、a、bをある定数として次式が成り立つと前提する。これが回帰の問題である。
・・・(1)
実際の測定が行われるときには、通常Yについて誤差を伴うため、Xの値をxとしたとき、母集団全体におけるyの平均値E(y)に対して、、を定数として次の線形回帰を考える。
・・・(2)
、、はそれぞれ0次、1次の母回帰係数と呼ばれる。
、は母集団の値を持つと仮定されるので、Xの値をx1、x2、・・・といろいろ変えてYの値を実測しても一般に確定できないことを知っている必要がある。
そこで誤差εをここに想定し、εが正規分布
をするものとすれば、式(2)を次のように書き直すことにより実際問題を取り扱うことが可能となる。
・・・(3)
この想定について、次のように言い直すことができる。
Xの値がxのとき、Yの値が範囲 y<Y<y+dy に入る確率を
p(y|x)dy の記号で表すなら、それは次の確率密度関数によって与えられる。
・・・(4)
σE2がxの値によらないなら、、の推定値をa、bとして定法通りそれぞれ次のように与えることができる。
・・・(5)
・・・(6)
ただし、
・・・(7)
・・・(8)
・・・(9)
・・・(10)
・・・(11)
回帰分析において扱われるデータ群、(x1,y1) (x2,y2) ・・・ (xN,yN) は任意の標本群であるが、通常N個のx1, x2, ・・・xN は定められている。したがって、上の式(9)で与えられるSxxは定数として取り扱う。
標本回帰式と回帰による誤差
式(5)、(6)によって示される下の式(12)は、xによるyの標本回帰式、あるいはyのxに対する標本回帰式と呼ばれる、
・・・(12)
X=xiによって推定されるYの値をとして、式(12)を利用すれば式(13)で与えられる。
・・・(13)
標本回帰式(12)によって推定される推定値と実測値の食い違いは残差、もしくは予測誤差と呼ばれる。残差を記号diとすると、それは次式で示すことができる。
・・・(14)
それぞれの実測値に対する残差を二乗して合計したものを残差平方和という。
・・・(15)
式(13)について、0次標本回帰係数aを式(6)で置き換えるとyの推定値を示す式は次のようになる。
・・・(16)
式(16)を用いて残差平方和を求めることにする。
これを簡略化するために式(9)、(10)、(11)を利用すれば残差平方和は次式で示される。
・・・(17)
式(17)に含まれる1次標本回帰係数bは、すでに式(5)によって与えられているのでこれを利用すると、次のようにまとめられる。
すなわち
・・・(18)
式(18)によって、残差平方和が、Xの変化による変動をYの変動から差し引いたものと解釈される。右辺の第二項がXの変化による変動であり、一般にYのXに対する回帰項と呼ばれている。
残差平方和の自由度は、N-2である。