正規分布

 臨床検査だけにとどまらず、分布モデルの中でもっとも広く用いられるのは正規分布である。
 正規分布の密度関数は、次のように定義される。

・・・(A-9)

 は、この分布の平均、は標準偏差である。
 ここで、変数tを用いて、次の変換を行う。

・・・(A-10)

(A-10)式の両辺に対して微分を求めれば

・・・(A-11)

  であるので
 これを、(A-9)式に当てはめれば、次の式が得られる。

・・・(A-12)

この式は、(A-8)式と同じである。
したがって、(A-7)で求めたように、−∞から+∞間においてこの式を積分すれば、その値は1となる。この関数式の描く曲線は下図のような左右対称の釣り鐘型である。
図2.正規分布の確率密度関数
図2.正規分布の確率密度関数

また、とくに、=0、=1のときを標準正規分布と呼ぶ。
 xが正規分布にしたがうとき、次式で変換することを規準化、あるいは標準化と呼ぶ。

・・・(A-13)

Zによって変換された正規分布の確率密度関数は、基準正規分布の確率密度関数と呼び、次の式で定義される。

・・・(A-14)

この関数は次の曲線グラフを与える。
図3.基準正規確率密度関数のグラフ
図3.基準正規確率密度関数のグラフ

基準正規分布の確率密度関数を利用すれば、標本の値で区切られる区間の確率をそのグラフの下の面積で知ることができる。このことは、正規分布をする集団の平均値と標準偏差を知っていれば、(A-13)式によって規準化することにより、知りたい確率を基準正規分布のそれで知ることができるということを意味する。
確率変数zがAより小さい値をとるときの確率は、上の図で、左側の色の付いた部分の面積に当たる。このとき、(A-13)式によって変換した元の確率変数xは、
変換式
・・・(A-13)
から、

 x=µ+z  ・・・(A-15)

で示される点であり、先の正規分布の確率密度関数のグラフに示してある。
図の左側の色の付いた部分の面積は、 z≦Aであるときの確率を意味しており、確率を記号Pを用いて次のように表される。そしてその確率は続く積分で計算される。

・・・(A-16)

また、図の右に示したグレーの部分に相当するのは、 z≧Aであるときの確率を意味しており、同様に確率は次の積分で与えられる。

・・・(A-17)

たとえば、本文中において取り扱っているトランスアミナーゼの分布で、N(180、42)の分布について、184 IU/l以上の値を示すものの割合を基準正規分布に当てはめて求めてみよう。
184 IU/l以上の値を示すものの割合というのを記号化すると、

P(x≧184)

変換式(A-13)式を用いて、それぞれ次の値を適用すれば、


 手元にある標準正規分布表を参照して、A=1.00の値を読むと、0.1587である。
 
 すなわち、N(180、42)の分布をするトランスアミナーゼで、184 IU/l以上の値を示すものの確率は、0.1587、あるいは15.9%である。
 
 しばしば使われる確率は、全体の2.5%を占めている最大値側あるいは最小値側の群、もしくはその両方を含む群、もしくはその両方の5%を占める群を除いた残りの95%の群に対する確率である。下図の色を付けた部分に相当する。
 
 このときも今と同様、P(z≧A) = 0.025 となる、Aの値を正規分布表から読みとる。これに相当するのは、A= +1.96 である。同じようにして、P(z≦-A) = 0.025 に相当するのは、A= -1.96 である。すなわち、[平均値+1.96×標準偏差]〜[平均値-1.96×標準偏差]の間にあるのは全体のうちの95%に相当する。同じようにして次のよく使われる数値が得られる。
[平均値+1×標準偏差]〜[平均値−1×標準偏差]の間にあるのは全体のうちの68.3%
[平均値+3×標準偏差]〜[平均値−3×標準偏差]の間にあるのは全体のうちの99.7%

正規分布表
閉じる