SOLUTION
検査室支援情報
精度管理の考え方
8. 数理統計学的なもくろみ(2)
8.9 管理目標
正規分布をする母集団から取り出した標本の数がそれほど多くないとき、t分布を数学モデルとして利用すれば、母集団の母標準偏差を知らなくとも母平均を区間推定することができることがわかった。
これで、実際に測定してみるまで知らなかった精度管理物質AのASTの値が、ある区間の中に95%の確率で存在するだろうと言えるまでに至った。
それでは、いよいよその区間を精度管理目標に使うことができるようになったのだろうか。
今、t分布を用いて行ったことはこういうことである。すなわち、母集団から1回につき2個のデータを標本として取り出し、その平均値を求め、その平均値n個を使って母平均の区間推定をした。そして提示された区間には、95%の確率(信頼水準と呼んだ)で母平均が存在するものとして提示される。
そこで我々はこれに続いて新しく2個のデータを取り出し、その平均値を求め、この推定された区間に当てはめ、次の判断をしてみようというのである。いったい、その推定区間内に新しい平均値があれば、それらは母平均の推定をするのにn個を取り出した母集団と同じ集団から取り出した標本と判断してよいのだろうか。そして、それで元の精度管理物質AのAST活性の値とは<差がない>と言え、新しく行った測定作業に問題がなかったと言えるのだろうか。
8.10 平均値の管理
母平均の推定では、取り出した5個の標本平均値よりも10個の標本平均値を使えば、同じ信頼水準であっても区間推定の幅は狭まる。さらに10個の平均値よりも20個ではもっと狭まる。それなら、あらかじめ日常の精度管理を始めるに当たって数値目標を設定するために、いったい何個の平均値を集めればよいのだろうか。その答えは、もっぱら各医療機関の事情で判断することになるだろうということである。
注:母平均の推定に必要な標本の大きさを決めるためには、母標準偏差を知っている必要がある。その場合、推定で収めたい誤差の母標準偏差に対する割合を1/dとすると、
母平均の推定をするのに必要なn個の数は、次の式で与えられる。
ただし、 は推定に際して収めたい誤差:単位は標準偏差と同じ
zは95%信頼水準なら1.96である。
例:AST活性の測定で、母標準偏差が10 IU/l であるとして、信頼性水準95%で推定するとき測定誤差を± 5 IU/l に収めたいのならば、
16個の平均値をもって行えばよい。
さらに別の問題がある。それは、1つの平均値を出すために2回の重複測定しか行っていないが、この重複測定も多い方が精度が高くなるだろうということは理論的に頷ける。とはいえ、回数よりおそらく1つの平均値を求めるために重複測定したときの再現性、つまり標準偏差に問題があるときにはそれをなおざりにできない。
このため、日常の精度管理では、1つの平均値を出すために行った重複測定のバラツキを、母平均の区間推定をしたときのバラツキ以内とするという管理目標を、別の管理基準として設けるのが一般である。
-R(エックスバー・アール)管理図法、あるいは-s(エックスバー・エス)管理図法が、平均値の管理と、それを求めたときのバラツキの幅、あるいは標準偏差を組み合わせ、図式化して管理する手法である。これについては、さらに後で述べることにする。
今、現実的なことを考えると、平均値の区間推定をした後、これを日常の数値目標として管理基準にしてしまえば、その後はその管理基準を変更するわけにはいかない。したがって、管理基準としての区間推定をするために何個の平均値を集めるかは、その施設において議論し経済的に達成できると考える範囲が妥当であろう。
さらに、今考えてきた精度管理物質の測定に即していえば、1つの測定作業の区切りをもって平均値の標本を取り出してきた。これからその管理基準に照らすための対象は、そういう見方をすれば、新しい作業区切りということになる。1つの作業区切りを、「ロット」とよぶことにする。図で測定作業の列を示すと次のようである。
精度管理は、こうしてとぎれなく続く測定の流れに対して、これまでと同様に作業が行われることが期待され、同じ水準の精度で測定値が得られることが期待されている。
ここに、上の図を見れば明らかな別の問題がある。それは、ロット間のバラツキである。つまり、平均値の推定をするために統計計算に組み入れられたロットの列での標準偏差をここで1つのロットと考え、ロット内の標準偏差として で表すと、これから始まる新しいロットとロットの間では、それぞれが独立して計算されるのでこれをロット間の標準偏差、 とすると、 の標準偏差 は次のように表される。
・・・(c-16)
すなわち、管理基準にはロット間のバラツキが含まれていないにも関わらず、毎日測定される現実のロットにはそれぞれ独立したバラツキがあって、(c-16)式の に現れてくる。これは、複数の分析系で同じ管理基準を適用したときも言えることであって、管理限界を容易にはずれさせる要因となるだろう。なぜなら、おそらくロットが変わればキャリブレーションが変わり、またさまざまな条件も変わることが予想されるからである。
現実問題として、こうした詳細の考察をすべて管理基準に取り込もうとすると、日常の作業そのものが煩雑になり、簡単な手法で精度の保証をしようという意図が挫かれ、果ては管理そのものへの姿勢を萎えさせるものとなる危険がある。
8.11 第1種の誤りと第2種の誤り
現実を考えると、精度管理を必要以上に厳密にせず、また、一方では見逃しは少なくする努力を考えるべきである。
この議論は、判断における過誤の問題として取り上げられている。たとえば標本の平均値を数値目標によって管理するとき、上の計算例では95%の信頼水準を適用した。すると、5%のケースでその平均値が同じ母集団から得たものであるにもかかわらず、そうではないと判断されて、測定系に平均値を動かす何らかの異常があったと判断される結果になる。これは、1日1ロットを実施している検査室では100日に5回、つまり実稼働1ヶ月に1回はそうした判断があっても統計学的には不思議はない。このような過誤を「第1種の誤り」という。同一の母集団からのデータであるのに違った母集団からのものだと判断するので、早とちりで「あわて者の誤り」、と俗に言われる。記号αで表すことが多い。
これに対して異なった母集団からのデータであるのに、いつもと同じの母集団から得たものと判断する過誤を「第2種の誤り」という。別名、「ぼんやりものの誤り」ともいわれ、記号ßで表される。
精度管理の問題で、測定作業上、厳しくしなければならないのは、ずれているのに気づかない、ということをなくすことが大切であるが、その危険率を5%として固定的に考える必要はない。区間推定を狭くして管理基準を厳しくすることによって、第1種の誤りは犯しやすくなり、なかなか精度上合格と見なせる報告ができなくなる。
数値目標の設定では、数値目標を求めるための重複測定回数を増やす方法でも管理基準の厳しさは変化する。式(c-16)でnを増やせばバラツキの幅は狭くなり、管理基準からはずれやすくなる。
8.12 具体的な管理基準
工業製品の生産過程で用いられている-R 管理図法では、もっぱら、±3SD幅を管理限界線として利用している。これならば、正規分布モデルを適用して0.27%に不合格の判定を与える。およそ1000ロットで3回が外れる予想である。この理由は第1種の誤りをおそれるあまり、これまで述べてきたような95%域を合格とする管理範囲の取り方をすると、不合格となるケースが勢い増えて、非効率的な工程管理を実施することになって、経費がかさみすぎる危険が大きいからである。
正規分布モデルで、95%域を合格とするか、99.7%を合格域とするかは、各施設による判断である。それはその医療機関で利用される臨床検査情報の信頼性に対して、いくらの経費を割いてそれを保証するか、重要な経営判断の一つと言ってよいだろう。
いずれにしても、留意を必要とすることが何点かある。
平均値の管理をするとき、その平均値を計算することになった元の群、すなわち1つのロットに対して厳密な定義が必要であること。平均値の管理は、ロットを対象としているので、ロットの定義が曖昧であると、合格不合格の管理上の判断を何に対して行ったのかあやふやになってしまい、結局そうした管理判断に対する不必要論に発展しかねない。
95%範囲内であれ、99.7%範囲内であれ基準を決定したとき、それに照らして管理上の判断をしようとするロットの平均値が管理範囲を超えたときは、平均値そのものにずれが生じたと考え、その原因を追及して排除する努力が必要である。これは、これまでの議論で明らかなように、ある精度管理物質を多重測定して設定した管理域は、そもそもその成分濃度に対する母集団の母平均も母標準偏差も分からないのだから、標本平均や標本標準偏差で推定しようとしたものである。したがって、計算で得られた95%幅というのは、その中に母平均が95%の見当で存在するだろうと考える推定域である。したがって、続くロットの標本平均値がその中になければならないという根拠は論理のすり替えであって、これまでの推定の仕方では、変動する平均値と変動するその推定域が、管理を始めるに当たって設定された一つのもの、すなわちそもそもの母集団の推定値に一致するとは言えない。
管理を始めるに当たって設定した数値目標は、ある数の標本平均値でその母集団の母平均を推定するために計算したものである。独立した次のロットの標本平均値は、同じ母集団からのものであるから、同じ母平均を推定するとはいえ、先の95%推定域と同じ95%推定域を与えるとは言っていない。ここで活用されている知識は、ある一つの母集団に対して標本を重複して取り出せば、その標本平均値は標本数が増すに連れ、母平均に漸近的に近づくという中心極限定理の応用である。
管理目標として設定する母平均の推定域に、新しい標本平均値があるなら、少なくとも全く異なった母集団から得た標本であると言いづらいが、その推定域をはずした場合には、異なった母集団から標本を取り出したと考えなければならない。すなわちこれまでと同じ状態で測定の作業が行われたということを疑わざるを得ない。
しかし、管理範囲内であっても、必ずしも問題ないか、というとそうではない。後述の管理図の見方でさらに詳しく議論する。
8.13 管理図
正規分布をモデルとして、これまで精度管理に用いる数値目標を検討してきた結果、標本の平均値は標本がどんな分布をしていても、中心極限定理によって標本平均は漸近的に母平均と一致するということが分かった。ところが、管理目標として上限と下限のある閾値を設定し、その区間内に現在進行しているロットの標本平均が入るならば、そのロットを合格としたいのだが、区間推定には母標準偏差を知らなければならなかった。そこで、t分布を利用して標本標準偏差から母標準偏差の区間推定を行った。これは、母集団からn個の標本を取り出したとき、母平均がどこにあるかを推定するもので、取り出す標本によって推定区間は変動し、次のn個の測定値がこの区間内にあることを保証するものではない。
しかしながら、この母平均の区間推定は中心極限定理による限り、それをはずれることは新しい標本が違う母集団から取り出されたことを、すなわち平均値が異なった母集団から取り出されたことを疑う根拠として利用して良さそうである。
すなわち、(C-13)式から
・・・(C-13)
・・・(C-13)
一方では標本の標準偏差Sを利用して、母平均の区間推定をするとき、標本標準偏差が正規分布をしないため正規分布をモデルとして当てはめ正規分布表から数値を利用するということができなかった。そこで標準偏差の分布モデルとして、χ2分布を利用した。それにより標本標準偏差を使って母標準偏差を推定することができた。そこで、母平均の区間推定を、母標準偏差の推定値から設定できる。工場などにおける工程管理では、JISからこの方法を使うことが推奨されている。もちろん、より一般的な方法ではR管理図が推奨されていることは断る必要もないだろう。
(F-19)式によって
・・・(F-19)
であるから、
・・・(C-14)
これを次の式に当てはめる。ただし、µは標本平均の平均値 (エックスバー・バー)をもって、標本標準偏差E(S)は、その平均値 をもって計算する。
上方管理限界 ・・・(C-15)
下方管理限界 ・・・(C-16)
ただし、zは、3SD範囲を超えるときに警告する場合には z=3 とし、そのほかの値をとる場合には、変更すればよい。
8.14 s管理図
標本の標準偏差の推定値の数学的な取り扱いから、(F-18)式を用いて、
・・・(F-18)
あるいは、(F-18)式を簡単に表現した(F-19)式から
・・・(F-19)
ただし、
・・・(F-20)
また、標本標準偏差の分散からその標準偏差を求めた式
・・・(F-24)
もしくは
・・・(F-25)
を用いて、s管理図の上方管理限界と下方管理限界を設定することができる。
まず、(F-19)式から母標準偏差を推定する。すなわち、
・・・(F-19)
であるから、
・・・(F-26)
管理限界は、
・・・(F-27)
として、
これに、(F-26)式を当てはめれば、
・・・(F-28)
ただし、
・・・(F-20)
・・・(F-29)
s管理図の管理限界はそれぞれ次の通りである。
上方管理限界
下方管理限界
ただし、下方管理限界はn<6では、実際上意味がないことと、ばらつきが小さすぎるということが問題とする必要性が低いため、上方限界だけを設定すればよい。
注:すでに、上述したとおり、精度管理試料はそもそも検定された値をもっているものではないため、あらかじめ予備的な作業によってこうした管理限界を設定することになる。これまでは、コンピューターによる数値計算の簡略化が現場で実施するのに困難であったという理由から、それを普及させる努力を払ってきた日科技連などからすでにテキストとして出版されているものに掲載された表から管理限界を簡単に求めてきた。そうした場合には、標準偏差の管理をする代わりに測定値の範囲Rを利用するのが一般的であった。しかし、範囲Rの監視では極端にはずれた値を出す作業が含まれる場合には、敏感であるが、平均的な見方をするのは標準偏差Sを見る方が優れている。また、標本数に左右されない。今日ではコンピュータによる数値計算はさほど困難ではないので、各自で計算に挑戦されたい。
マイクロソフト社のExcelを使った関数計算では別表のような関数が準備されているので、いっそう便利である。