SOLUTION

検査室支援情報

精度管理の考え方中 恵一

8. 数理統計学的なもくろみ(1)

数理統計学上の結論を得るためには、次の両方面からのアプローチが考えられる。

  1. 標本」がどうであれ理論的な考察に基づいて推論を進める
  2. 得られた標本の特徴からヒントを得て一つのモデルを適応する

すなわち、測定対象や測定系が立脚している理論上のことから推論されるモデルを当てはめて結論を導くことが可能な場合もあり、実際の経験から得たデータを考察して、試行錯誤になる危険があるものの、何らかの推論を続けて結論に至る方法がある。

理論的な分布モデルでは、測定値が無限個あると抽象されており、その無限の測定値のかたまりを「母集団」populationと呼ぶ。実際の経験から得た測定値が、その母集団の一部とみなすこともできるが、その測定値はあくまでも一部であって、必ずしも母集団の姿を映し出しているとはいえない。

統計学上の考察をするときには、「標本」はモデルとする母集団から「抽出」されたものであるとすることが前提になっている。この場合、「無作為抽出」にしたがっているなら、「標本」は母集団の特徴を反映すると考えることができる。

例えば、標本を代表する「標本平均」から、「母集団の平均」を推定するもっとも良い方法は、算術的な平均値を求めることである。測定回数が多いほど、すなわち標本の数が多いほど、より精確な母集団の平均値を推定値として与える。

測定値である「標本」が、正規分布モデルにしたがわない場合、算術平均値は一般に期待される分布の中央値と一致しない。このようなとき、標本の抽出がランダムではなかったのか、モデルとして正規分布を強要しようとしたのか、理論的な考察では判断が付かない。現場に出かけて、その日なされた作業の詳細をすべて検討することから始める必要があるだろう。

8.1 統計的検定

数理統計学的な分析には、上述した二つの局面があることを理解することが重要である。

一つは<帰納的>なもので、「標本」から「母集団」へ推理を進めて行く。もう一つは、「母集団」から無作為抽出によって得ることのできるすべての場合の一つとして「標本」を考える<演繹的>なものである。第二の局面は、第一のそれを批判し、確からしさを確率で与える数学的な手法である。

経験的に得られた「標本」と、数学上理論的な「母集団」の特性値との間に認められる差が、「標本抽出の偶然な誤差に基づく」という仮説を検証することは、「検定」と呼ぶ数理統計学上の重要な手法の一つである。

8.2 数値目標

臨床検査を高い精度で実施するために「統計的な管理状態」の達成に努力すれば、測定に対する「均一性」が確立できることを上述した。しかし「均一性」が可能となっても、なお現実には測定に微少なバラツキが残ることを前提として、ここに正規分布のような数学モデルを利用し、測定値が「ある限界内で再現できること」を示す管理手法について議論しなければならない。「ある限界内」こそ「バラツキ」の本体であり、そのバラツキの限界を与えられた経済上の目標以内にとどめることが精度管理の第一の目標である。その目標の達成に必要な数理統計学的な手法についてこれから議論しよう。

今日現場では、プール血清など、精度管理物質とよばれるものを便宜的に利用して、この測定値精度を確認する手法が用いられている。ここでいう精度は、正確さと再現性(精密さ)をあわせた「精確さ」をいうが、はたしてわれわれは「精度管理物質」を利用して、そうした精確さを達成するための具体的な目標値を設定することができるのだろうか。

ここで重要なことを確認しておかなければならない。実際、そうした「精度管理血清」は、第1次標準物質でも、第2次標準物質でもないので、いわゆる検定された、あるいは認証された値をもつものではない。また、たとえそれを標準法で値付けしたとしても、そもそもそれがいずれかのレベルで標準物質として使いうるすべての物理化学的性質を備えているかどうか、その保証すら与えられていない。

つまり、たいていそういう精度管理物質は、「管理目標とすべき値」をもっていないし、どんな成分についても我々はその真値を知らないのである。

そこで、我々ができることは、まずそれを「統計的な管理状態」にある測定系で測定して、何らかの手がかりとなる値を得ることであるが、何も情報がない新しい精度管理物質について最初にできることは重複測定して、その平均値である成分濃度の値を知ることから始めるしかないだろう。「統計的な管理状態」にある測定系とわざわざ断るのは、今から測定して測定結果を得ることになるが、それは、「標本」とよばれる値で、我々が知りたいのはその「母集団」の値であるから、あくまでも測定値の集団が理想として正規分布するように考えるなら、その集団からランダムに取り出した測定値をもって母集団の平均値、すなわち知りうる範囲内で最良の真値を推定しなければならない。このため「統計的な管理状態」にある測定系が欠かせない。

はたしてそうして得た平均値は日常の管理目標になりうるのだろうか、というのが議論の主題であるが、ともかく実際にやってみることにしよう。

8.3 精度管理物質の推定値

ここにA社の精度管理物質があって、それはヒト血清にさまざまな成分を添加調製してある。これをしばらくの間、「精度管理物質A」と呼ぶことにする。この精度管理物質Aを使って、日常生化学検査の血清アスパラギン酸トランスアミナーゼ(AST)活性測定に関する精度管理を考えよう。

十分注意して調整された自動分析装置を使って、PALP添加された国際標準法でAST活性を2回したところ、次の結果を得た。
148 IU/l 147 IU/l

この2つの測定結果から、精度管理物質AのAST活性の真値を推定してみよう。「平均値」は、得られた標本を使って、高い方にも低い方にも偏らない「不偏推定値」として提示できる。

今、標本として得られた測定値は2つである。その平均値は、次の通り。
  

この計算の結果から、精度管理物質AのAST活性について、その真値の推定値は、今のところ147.5 IU/l が最良のものである。

今この147.5 IU/l が唯一真値の推定値として提示できるものであったとしても、これはあくまで「標本」として得た、148と147の2つを使っただけであり、この推定にはそれほどの自信は持てない。

この2つの数値は、「母集団」としてある、無限のAST活性測定値からたまたま2つ選んだ「標本」からの推定であって、たまたま集団の分布の端を選んだ可能性も否定できないからである。
さらに考えなければならないことは、「点推定」では、そもそもの目的である「日常の管理目標」として、精度上合格とする「管理範囲」を定めることができない。

つまり、次にこの精度管理物質Aを同じ測定系で測定したとき、147.5 IU/lという結果が得られなければ、その測定系が先と同じ状態であったかどうかが判断できない。我々が必要なのは「幅」のある管理目標であろう。

そこで、「管理範囲」を求めることを念頭に、精度管理物質Aについて母集団のAST活性の真値が、この範囲にあると推定し提示できるものか考えることにしよう。

これは推定値の存在する区間をいうことになるので、数理統計学では「区間推定」とよぶ。推定範囲の広さは任意で決めることになり、それは推定に対する信頼性の程度を意味し、「信頼水準」とよばれる。

区間推定」を行うに際して必要になるのは、バラツキに関する情報である。ここに今あるのは、148 IU/l と147 IU/l の2つの測定結果で、たとえば測定値の最大値と最小値で表される「範囲」はバラツキに関する一般的な数学的データとして使われる。また「標準偏差」も、バラツキに関する情報として一般的である。ここでは、正規分布を数学モデルとして利用しようとしており、それで母集団に関する情報を得る試みに挑戦している。母集団の「母平均値」や「母標準偏差」などの「母数」に対してより精密な推定をしようとしているので、まず「標本標準偏差」をこれから計算してみよう。

ここで再確認しておかなければならないことは、今ここで計算しようとしている「標本標準偏差」は、「標本」についての標準偏差であることである。「母集団」の母数としての「母標準偏差」ではない。我々が今やろうとしていることは、精度管理物質Aについて測定して得た2つの測定結果、148 IU/l と147 IU/l の2つの「標本」から、ある信頼性の範囲で「母標準偏差」を推定し、さらにそれを使って「母平均」を推定することである。

8.4 母標準偏差と標本標準偏差

ともかく得られている、148 IU/l と147 IU/l の2つの測定結果から、定法通りに標準偏差を計算することにしよう。
平均値は上で計算した。147.5 IU/lであるから、「標本分散」s2 は次のように計算される。

「標本」の分散はs2 =0.52で、「標本標準偏差」sはこの分散の平方根を求め、s=0.5 IU/l と計算される。(補注:s2=0.52=0.25 と書いてもよいが、標準偏差を計算したいので、二乗のままで表現した)

ここで、「標本分散」と「標本標準偏差」をもとにして、母集団の「母分散」2と「母標準偏差」を知りたいので、その推量をするため、もう一度改めて分散と標準偏差の計算を詳しく見ておこう。
(補注:くどいようであるが、「標本標準偏差」は、s:エスで示し、「母標準偏差」は:シグマで示して、両者を明確に区別しておこう)

分散は、第2次のモーメントであったので、より一般的な式はモーメントの項をおさらいしておきたい。上で用いた「標本分散」を求めるために使った式(c-1)を簡略化して書き直せば、分散は、第2次のモーメントであったので、より一般的な式は
 ・・・(c-2)

は標本の平均値で、式で表すと次のようになる。
 ・・・(c-3)

母集団の母標準偏差を推定するために、ここで、母集団の母平均µを(c-2)式に当てはめよう。
 ・・・(c-4)
Σの中を計算しよう。

なぜなら、

だから。

そこで、(c-4)式は、
 ・・・(c-5)

(c-5)式の第1項は、まさしく母分散2であり、第2項は標本平均の母集団の平均値、すなわち母平均、に対する分散であり、それは、2/n であるから(中心極限定理を参照)、
 ・・・(c-6)

この式が意味するところは、標本分散は母分散より少し小さい値(n-1はnより必ず小さい)をとるということである。
そこで、標本分散を使って母分散を推定することを考えよう。

推定値はそれぞれの記号の上に(ハット)を付けるのが習慣だから母分散に対する推定値は、記号 を使うことにする。(c-6)式から
 ・・・(c-7)

(c-2)式からs2を、(c-7)式に用いると、
 ・・・(c-8)

「標本」の値xiから母集団の「母分散」を推定するときには(c-8)式の分母に示されるように、自由度を1個へらして(n-1)を使うのがよいことがわかる。このことは、今後もしばしば利用するので、覚えておきたい。

(補注:以下の説明で「標本分散」には、記号s2を用い、その分母にn-1ではなくnをそのまま用いる。一般のテキストでは、断りなく「母分散の推定値」として取り扱う「標本分散」を指すことがあり、その場合、分母にn-1を当てている。本テキストでは(c-8)式で示される「母分散の推定値」を「標本分散」と別に扱い、断らない場合はすべて標本分散s2の分母には、nを用いることにする)

8.5 母平均の区間推定

先ほど、精度管理物質Aに対してAST活性値の測定を行い、148 IU/lと147 IU/l の2つの測定値を標本として得た後、母平均値の推定をその標本平均を計算して、147.5 IU/lと点推定した。
すなわち母平均値の推定値を、次のように推定した。
 ・・・(c-9)

さらに信頼できる範囲での区間推定をするに当たって、我々は母平均値も知らないくらいであるから、母標準偏差も知らないので、それをどうするか思案した結果、(c-7)式のように母分散を推定することができることを知った。ここにもう一度書けば、次のようである。
 ・・・(c-7)

正規分布モデルを利用すれば、平均値に対して標準偏差の±1.96倍の幅の範囲をとれば、集団の95%がその中にあることが分かっている。母平均値の存在する区間は母標準偏差さえ知っていれば容易に求まる。ところがそれは得られた標本結果から推定するしかなかった。

そこで今、まだ知らない母標準偏差を推定するために母分散の推定値を求める努力をした結果(c-7)を得たばかりである。そこで、この母分散の推定値から母標準偏差の推定値を得て、母平均値の存在する区間を推定しようというのである。
ここで、一つの問題にぶつかる。

それは、母平均の推定値に対する信頼性区間を求めるために、標本平均と標本標準偏差を利用しようとしているのだが、標本平均の分布は正規分布をしているのに対して、他方の標本分散及びそれから計算される標本標準偏差は別に記述するように正規分布をしないということである。

正規分布の基本モデルは、平均値0、分散1の分布をする、基準正規分布N(0,1)が使われる。今は、標本平均 が、平均値µの周り の標準偏差で正規分布をするという性質を利用して、モデルにこの基準正規分布を利用しようとした。(再び中心極限定理を参照
ところが、標準偏差の推定値の計算に利用しようとしている、標本分散が正規分布をしていないので、この基準正規分布をモデルとして利用できない。

8.6 t分布を利用する

一般の正規分布をする集団に対して、基準正規分布をモデルとして利用するときには、Z変換式を用いる。
そのもとになる式は、正規分布N(µ,2)にしたがう確率変数X対して
 ・・・(c-10)

という変換をすると、zは、基準正規分布N (0, 1)にしたがう、という性質を利用するものである。

ところで今、標本平均 の分布に対して、平均値µの周りにの標準偏差 で正規分布をしていると見なそうとした。
そこで、ともかくこのまま、このZ変換を当てはめることにしよう。

上に示した一般的なZ変換式(c-10)に対して、標本の測定値xの代わりに を、母標準偏差の代わりに を用いると次のような変換式ができる。
 ・・・(c-11)

この式の母標準偏差をその推定値に置き換えるのに(c-7)式で得たs2から推定値 を利用すれば、式(c-11)のに次の値を用いることになる。
 ・・・(c-12)

すると(c-11)は、

となる。

ここで、この変換式にZを割り当てると混乱するので、t とおくことにすれば、
 ・・・(c-13)

となる。

一般の正規分布をする集合を基準正規分布に変換するのは、先のZ変換で行うことができたが、(c-13)で変換されるtの値は正規分布をしないと予想された。このために、このtの値がどのような分布をするか改めて知らなければならない。

幸いなことに、このtの値の分布について詳細に研究した研究者がいる。WS Gossetという人物で、Studentというペンネームを使ってその研究結果を公表した。そのおかげで現在では、このtの値がどのように分布するか詳細に知られている。その分布は「ステューデントのt分布」もしくは単に「t分布」とよばれている。

正規分布は、標本の数が変わっても形が変わらないのに対し、t分布は標本の数が少ないときと多いときとは形が変わる。標本の数が無限に近づけば、t分布は正規分布と一致する。(t分布を参照

精度管理物質Aを測定して2つのAST活性測定値、148 IU/lと147 IU/lを標本として得たことに話を戻そう。その標本平均は147.5 IU/、標本標準偏差は、0.5 IU/lと計算されている。そこで早速、(c-13)式を適応してtの計算をしてみよう。
 ・・・(c-14)

この式から母平均μは、次のように表すことができる。
  µ=147.5-0.5t ・・・(c-15)

この式にあるtの値は、t分布のパーセント点、ステュデントのt分布表として一般の数理統計学の本に与えられている。それを利用すると、(c-15)式のtの値は、自由度2-1=1で、両側有意水準0.05、すなわち信頼水準95%で、±12.706 が与えられる。そこで、(c-15)式に数値を入れると、

µ=147.5±6.353

が計算結果として得られる。

そこで、母平均は区間
147.5-6.353=141.147と 147.5+6.353=153.853
すなわち、141.1~153.9 IU/lの間にあることが、信頼水準95%で言えるという結論になる。

さらにいうなら、153.853 IU/l以上に母平均がある場合と、141.147 IU/l以下に母平均がある場合の双方をあわせても信頼水準が5%であるので、そんなことはめったに起こらないと言ってよいだろう。

8.7 推定の精度

精度管理物質Aに対する2つのAST活性測定値、148 IU/lと147 IU/lをもとに、そもそもの精度管理物質Aが有するAST活性測定値を推定した結果、母平均は153.9 IU/lから141.1 IU/lの間にあることが95%の信頼水準で言えることが分かった。しかし、2つの測定結果には、1 IU/lしか差がないにも関わらず、推測の結果は153.9-141.1=12.8 IU/lも差があって、実際推測しているということに疑問を感じてしまう。区間推定した結果の幅が広すぎるというわけだ。

これには、信頼水準ということを考えなくてはならない。実際50%信頼水準で再計算してみよう。
t分布表の自由度1、信頼水準0.5の値を読めば、t=1.000 と与えられる。
上の(c-15)式にこのt値を当てはめれば、次のように計算できる。

µ=147.5±0.5×1.000=147.5±0.5

すなわち、信頼水準50%ならば、母平均の推定区間は、147.0~148.0 IU/lである。

今の場合、たった2つの標本から母集団の母平均に対して推定しようというのである。これでは勢い無理も承知で、という事情を斟酌してもらわなければならない。

母平均がどこにあるか、その範囲を区間として言う場合に、95%の信頼で言うなら、つまり母平均をその区間から逃さないようにするなら、当然範囲を広くいわなければならない。たとえ広い範囲でいうようなおそまつさを示しても、そこにあればよいという実利をとるわけである。しかし、信頼性を50%のように当たるときとはずれるときと半々でもよいなら範囲は狭く言える。これは、逃走している犯人がどこに潜伏しているかを言うのと似ている。広い範囲、たとえば日本国内に潜伏している、と言うとまず海外へ逃げた形跡はないということであるが、さて何県か分からないというようなまだ捜査の行き届いていないことを言い、まあ当たらなくともよいからおよその見当を言ってみろと責め立てられて、東京都にいる可能性が高いと言ってしまったが、実際は名古屋にいると答えても同じくらいの見当だというようなことと同じである。

推定の時の信頼水準については、必ずしも95%にこだわる必要もないが、臨床検査の世界では一般的に95%をとることが多いので早とちりされずにすむ。95%と違った信頼水準の場合には、明確にそれを併記する必要がある。

8.8 標本の数を増やす

信頼水準を95%のまま、母平均の推定区間を幅狭くすることができないだろうか。
これは、中心極限定理を思い出せば、次のような性質があることを利用すればよいことに気がつくはずだ。
「1つの集団からくり返し標本を得てその平均値 を求めたとき、分布に関して、その元の分布の型に関わらず、漸近的に正規分布  にしたがう」
この正規分布の分散を見れば明らかなように、平均値の数nが大きくなれば分散は小さくなる。

実際そのことを確認してみよう。

先に2回ASTを測定した測定系を使って、精度管理物質Aをさらに重複測定する。このとき1回の測定で、精度管理物質Aを二重測定することにし、その平均値を求める。この操作を数回繰り返す。20回までの測定結果をASTの測定結果に示した。

n=5 で上から5回分の平均値を利用して母平均の区間を推定する計算をしよう。

ここで利用するのは、147.5、148.0、149.0、149.0、151.5 IU/lの5つの標本平均である。

これまでと同じように計算すると、次の結果を得る。
=149.0

式(c-13)を利用してt値を求め、母平均を区間推定すれば、

自由度4の信頼水準0.05のt値は分布表から、2.776
したがって、
  µ=149.0±0.689×2.776=149±l.913

平均値を5回とることによって、母平均は、147.1~150.9 IU/lの区間にあることが信頼水準95%で言うことができる。先に、2つの値を測定し、それを平均値として取り扱って計算した場合には、141.1~153.9 IU/lの間に母平均が存在すると推定したのに比べれば、だいぶ幅が狭くなった。

さらに標本平均の数を10に増やしてみよう。n=10で表の上から10個の平均値を使って計算する。
すると、次の結果を得る。

自由度9の信頼水準0.05のt値は分布表から、2.262
したがって、
  µ=148.7±0.520×2.262=148.7±l.176

n=10になると、母平均の推定区間は、
147.5~149.9 IU/l
と計算される。

最後にn=20で、計算してみよう。表にある20個の平均値をすべて使う。

自由度19の信頼水準0.05のt値は分布表から、2.093
したがって、
µ=148.825±0.449×2.093=148.825±0.949

n=20になると、母平均の推定区間は、
147.9~149.8 IU/l
と計算される。

こうして下表のように、標本平均の数が増えるにしたがって推定された区間の幅は狭くなり、数値目標として実用に耐えうるものになる。

n 推定された幅
2 153.9~141.1 IU/l
5 147.1~150.9 IU/l
10 147.5~149.9 IU/l
20 147.9~149.8 IU/l