SOLUTION

検査室支援情報

精度管理の考え方中 恵一

(付録) モデル分布への当てはめ

統計の上で直面する問題は、標本と呼ばれる観測された統計量を手がかりにして理論的なものを推定することにあり、両者の適合性を検定する問題である。したがって推計の立場から、標本の統計量がいかなる分布に従うかがもっとも興味がある。このことは、母集団から無作為に抽出された標本が、母集団の特性を示す確率変数の実現値であるとみなすことである。この確率変数を与える関数が統計量の分布法則を定めることであって、「標本分布の問題」という。

一回の試行である出来事が起きる確率をpとする。常にその出来事が起きるなら、確率p=1である。その出来事が起きない場合があるとき、その起きない確率をqとすれば、q=1-pである。n回の試行を独立に行ったとき、その出来事が起きる回数をxで表すことにする。すなわちn回のうちその出来事がx回起きる確率を求める問題である。
この出来事の確率は、すべての試行を独立と考えると、次の式で表される。

n回でどんな順序にその出来事が起きる起きないが現れてもよいと考えると、この現れ方は、n個の文字列を考えて、そのうちx個がpで残りのn-x個がqであるような順列の数に等しい。
その文字列についてすべての異なった順列は、次の式で与えられる。

したがって、一回の試行である出来事が確率pで起きるようなことをn回独立に試みたとき、n回のうちx回そのことが起きるのは、次の式で予測される。

この確率P(x)で与えられる分布を二項分布(binominal distribution)と呼ぶ。

二項分布は何回も繰り返すようなことに対する実際的な問題に有用である。しかしながら、試行回数nが大きくなると、上式のP(x)を計算するのは面倒である。
実際の観測値からヒストグラムを作成し、その度数を示す柱の頭を結んだ曲線を、ある理論的度数分布の曲線にうまく当てはめることができれば、当てはめた分布曲線から、その母集団の特性を予測することが可能である。通常観測されるデータは、母集団から無作為に抽出された標本と考えることができ、得られたヒストグラムに現れる分布曲線は、その母集団の特性を表す分布曲線に近似することが予測されるからである。

出現率Xの二項分布を母集団とするとき、その母平均 E(X) と母分散 V(X) は次の式で与えられる。

また、3次(歪度)および4次(尖度)の積率は次の通りである。

二項分布の歪度および尖度において、nを大きくすれば、3=0、4=3に近づき、正規分布のそれと同じになることが分かる。すなわち、試行回数nが大きくなれば、

の正規分布によって近似されることが予想される。
実際、二項変数をuとして次の変換をし、積率母関数を求めることによって二項変数の積率が正規分布のそれに近づくことが知れる。

ただし、二項分布はあくまでも正の整数値をとる観測値を対象とするような離散型の確率変数を考える分布であり、正規分布は連続型である。
一般則として、np>>5ならば、xは母平均np、母分散npqの正規分布をすると見てよい。ただし、次のuが母平均0、母分散1の正規分布N(0, 1)に従うものとする。

±1/2で補正することを、イェーツの連続修正を施すという。二項分布が離散型であるので、連続分布の(x-1/2, x+1/2)の範囲において、x以上ならx-1/2以上とし、x以下ならx+1/2とみなす。

試行回数nは大きいが、出来事の起きるのがきわめてまれで、確率pが非常に小さい場合に正規分布による近似をするのはまずい。すなわち、n<5のときに対して新しい近似が必要になる。
np=として、一定の値に留まるように、pを0に、nを無限大に近づけたときの極限分布はポアソン分布(Poisson distribution)として次式で与えられる。

母平均、母分散は次のように与えられる。

ポアソン分布は、出来事の起きる出現率を観測するとき、単位時間もしくは単位容積や面積については出現率が極めて小さいが、十分長い時間、あるいは十分大きな容積や面積を観測すれば出現しているものを扱うときに有用である。

分布

推計学において、広く使われる連続分布の一つは 分布(カイ二乗分布) である。
xを平均値0、分散1の正規分布をする変数とするとき、n個の標本を無作為に抽出し、これらをx1、x2、・・・xnとする。この平方和をと表すと、

このの分布を考える。
すると、標本数nをfとして、この分布は次の確率密度式によって与えられる。

f を自由度と呼ぶ。関数を表す。
式に含まれている母数は自由度の f だけであるから、自由度が変化すれば分布密度グラフは変化する。

自由度f1および自由度f2分布をする変量 がありこれらが互いに独立ならば、

は、自由度f=f1+f2分布に従う。これを分布の加法性という。
分布は自由度を無限大に近づけると、極限において正規型になる。
また、xが平均値0、分散の正規分布をしているとき、それから無作為に抽出されたn個の標本に関する標本分散をs2とすると、

は、自由度n-1の分布をする。この性質は重要である。

検定

ある観測を行って、観測値とその出現度数からヒストグラムを作成するために一次元分類の表を得たとしよう。観測値がk個の段階で分類されているとき、各段階値あるいは幅のある場合にはその中央値で、ここに出現する度数をOiとし、その期待度数をEiとする。観測値の分布に当てはめたいモデル関数のある場合には、期待度数としてそのモデル関数から算出すればよい。モデル関数が適合するかどうか検定するには、次式を計算する。<補足

自由度f=k-2の分布の上側確率を求める。たとえば、5%の危険率で検定する場合には、としてこれを計算するか表から求める。もし、上で計算したに対し

ならば、当てはめようとするモデル分布が適応するとはいえない。仮設の完全なる一致での期待値は、=0であることによる。自由度をk-2とするのは、出現率が予め決まったものではなくモデル関数を使って推測したことによるもので、自由度を1失い、f=k-1-1とするためである。

エクセルを使ったその例を付する。

例) Poisson Modelの当てはめ(20KB)