SOLUTION
検査室支援情報
精度管理の考え方
Q1 Answer
生化学の分野のことです。精度管理試料を一日に1回だけ測定しています。
したがってXバーR管理図にはなりません。このやり方は、間違っているのでしょうか?(大阪府 N.K.様)
一人の患者検体に対し、臨床検査が依頼された項目について、結果を報告しようとするとき、それは正しく測定されたものである、と言い切ろうとすると、いくつかの事項について確認を必要とするでしょう。「精度管理」の作業はこの確認事項を決め、一連の作業が定められた基準通りに収まっているかどうかを知ろうとする行為であり、またその事が確認された後に行われる「精度保証」では、どう行動をとるかも定められている必要があります。
例えばある製品を生産している工場において、すべての製品に対してそれが商品として通用するために必要な「規格」を満足しているか点検検査を行っている、と聞けば消費者は満足するでしょう。規格を知って購入しようとする賢い消費者は、製造者の誠意を信用するなら、「検査済み」の印を見て大いに安心できるはずです。しかしながら、臨床検査は、そもそも濃度が未知のものを測定の対象としていて、工場で製造される製品のように、定められた規格におさまる単一のものを繰り返し生産するという作業ではありません。
臨床検査では、未知の試料の測定結果に対して、それが「予め知られていた」として、「正確である」と断言するのは、それが本来求められているとはいえ困難です。予め知っている、というのと未知ということは矛盾します。
そこで、用意周到に臨床検査の測定過程を「正しく」調整準備し、その過程に関わるすべての作業が、『安定して繰り返されている』ことを「保証」しようと考えてみることにしました。
『作業が、安定して繰り返されている』ことを科学的に知ろうとするためには、「推計学的手法」が適しています。作業が『安定して繰り返されている』ならば、同一に準備した精度管理試料は、いつも期待される範囲内に測定結果が収まるに違いないと前提し、それが確認されたことによって「すべての作業過程が正しく進行した」と保証しようというのです。これが推計学・統計学を利用した精度管理です。
ここで、推計学・統計学の手法ということについて改めてその基礎を考えてみましょう。ここで基礎的なことをもう一度確認したいわけは、管理図がまさにその手法の一つだからです。
今、仮に「同一の試料」を100回繰り返して測定したとします。'測定作業が始めから終わりまで安定して同じように行われていれば'、測定結果のバラツキは小さいでしょう(この''でくくったところは重要な仮定ですから覚えておいて下さい)。バラツキは、すべてのデータから平均値を計算して、その平均値と箇々のデータとの差で見ることにします。
この『同一の試料に対して100回繰り返して測定する作業』を、毎日続けることにします。そうすると、私たちの興味は次のように表現できます。
第一日目に見たバラツキと同じバラツキをその後の日にも続けて、同じように見ると予想してもよいでしょうか
ここで、先程の測定作業に対する重要な仮定を思い出してみましょう。それは、'測定作業が始めから終わりまで安定して同じように行われていれば'、というものでした。
もし、測定作業が安定しているなら、そしてそれが毎日繰り返されるはずのものなら、毎日行われる100回の繰り返し測定のデータについて、平均値との差であるバラツキを100回すべての値に対して計算しなければならないでしょうか、それとも第一日目と同じだと考えてもよいでしょうか。
私たちは、第一日目に統計上の計算をして、平均値とバラツキを知ることができるでしょう。次の日も同じです。そしてその次の日も同じです。無限に繰り返される毎日の測定で得られるだろうすべての測定値は、きっとある一つの母集団に属するに違いありません。そして、その母集団に属するすべてのデータはある分布をし、あるバラツキを持っているはずです。毎日の100回の繰り返し測定の結果とは、その母集団から無作為(ランダム)に100個選んだセットだと考えてよいでしょう。なぜそう考えてよいかというと、'測定作業が始めから終わりまで安定して同じように行われている'、と仮定したからです。
同じように行われているという状態における1回の測定とは、1つの測定値をその母集団から間違いなく選ぶ、ということを意味しています。
基礎となる重要な前提:
一つの精度管理試料を重複して無限に測定したデータは、ある母集団に属している!
ここで、もしその母集団のことを知ることさえできれば、100回の同じ操作の反復について、『同一の試料に対して100回繰り返して測定する作業』をそのまま文字通り忠実に行わなくとも、『同一の試料に対して100回繰り返して測定する作業』に使った精度管理試料をごく少数本測定すれば、残りはそれぞれ違った試料を測定して合計100回の同じ操作の反復をすることにしてもよいのです。ごく少数精度管理試料を測定しなければならないのは、もちろんそれをしなくては、その日母集団を見失ってしまうからです。
ごく少数本というのが、母集団から無作為に取ってきた100個の測定値に対する、いわば代表選手です。
さて、問題は、母集団のことをどうすれば知り得るのかということです。
ここで、数学的な道具、即ち推計学上の手法を使うことになります。
つまり、最初の数日に得られた測定値の統計量から分布の情報を得て、これを母集団の推計に用いるのです。分布の個性を表すためには統計学でいう「モーメント(積率)」というものを利用します。これは数値で示されるため、分布の図がいかに母集団分布の姿を正確に表せるといっても、図だけではうまく表現できないズレを数値で表現できます。1次モーメントは平均値、2次モーメントは分散です。バラツキは分散として表現しましたから、これだけで十分役立つ情報になります。
では、実際の測定値から「その測定値はそもそもある母集団に属するデータである」と言うために、母集団を推計するにはどうすればよいのでしょう。母集団の分布について何も知らないでいて、1次モーメントと2次モーメントを知りたいと言ってもそれは無理難題です。
こういう場合には「分布モデル」を使うことを考えます。
とはいえ、実際のデータをみて、どういったモデルに当てはめて考えるか、ということはなかなか困難で、また一方とても重要なことです。モデルがしっかりしていて、あらゆるパラメーターが分かっていれば、現実に起こっている現象の分布を把握するのに都合がよいでしょう。
多くのモデルの中で、「正規分布」が最もよく調べ上げられていて、もしそれを使うことができれば大変好都合です。
では、実際どんなとき、この正規分布は使えるのでしょうか。
そもそも100回の反復測定に使った1本の精度管理試料について、ある成分に対しその測定値が実際にどのような分布をとるのかは大抵の場合分かりません。
そうした分布を記述統計として知ろうとするならば理論的には無限に、実際的には500回以上反復測定しなければなりません。それには大変な労力と経費がかかります。しかし、次の事実は一つの希望を与えてくれます。
今、一つの試料を準備し、これを数回測定し、その"平均値"を求めます。次いで、また同じ試料を数回測定し、新しい測定値からまたその"平均値"を求めます。この作業を繰り返して、すべての"平均値"について、その分布を見ることにします。この作業を繰り返して、"平均値"の数が多くなれば、その分布は正規分布に近づくということが分かっているのです。
精度管理試料のある成分の測定値の母集団がどのような分布をとっていても、そこから標本を取り出して"平均値"を求める操作を繰り返せば、その平均値(平均値の平均値です)は母集団の平均値に収束し、1回1回得られる平均値の分布は正規分布に収束します。これを「中心極限定理」と言います。
「中心極限定理」について分かりやすい例を挙げると、サイコロを投げたときに出る目の平均値の分布が挙げられます。インチキがないサイコロは、1から6までどの目の出る確率もそれぞれ6分の1です。したがってサイコロを1回投げたときに出る目を確率変数として分布図を描くと、それは長方形になります。これが元の分布です。
次に、そのサイコロを2個(または2回)投げて出た目の平均値を求めます。
2と5なら、(2+5)/ 2 = 3.5がデータです。
確率を考えると、1から6までのデータとその期待値は下表のようになります。
データ | 1 | 1.5 | 2 | 2.5 | 3 | 3.5 | 4 | 4.5 | 5 | 5.5 | 6 |
---|---|---|---|---|---|---|---|---|---|---|---|
期待値 (×36) |
1 | 2 | 3 | 4 | 5 | 6 | 5 | 4 | 3 | 2 | 1 |
このようにして、サイコロを投げる個数(または回数)を増やせば、分布のなかで中央の平均値の頻度が最も高い釣り鐘型に尖って行くのが容易に予想されるでしょうし、また実際にそうなります。
例えば、1の目が出る確率は元の分布では1/6でしたがサイコロを5個使ったとき、その平均値が1になる確率は1/7776です。これに対して、中央の値となる確率は780/7776です。
「中心極限定理」に従えば、確率変数の元の分布がどのような形であっても、そこから標本を複数取り出して得た「平均値」を確率変数とする分布は「正規分布」に近づきます。これは、私たちにとって大変都合がよい定理です。
ここでようやくご質問の本題に入ることができます。
管理図を用いる精度管理においては、日々の精度管理試料測定データからその平均値(Xバーです)を用います。平均値を用いる理由は、上で説明した、精度管理試料の測定値に対する母集団を知らなくとも、標本の平均値を繰り返し求めれば、その平均値(平均値の平均値)は母集団の平均値に収束し、その分布の形は正規分布に収束するという中心極限定理の性質を利用しているからです。平均値を求めるための最低必要本数は2本です。
管理図の基本統計量を求めるために多重・複数日測定した精度管理試料の測定結果の平均値は母平均の推計値と見なすことができます。それは日々、平均値を管理するための中心線を与えます。また、そのRは、標準偏差の代用として母標準偏差の推計値を求めるために使われ、母平均に対する推定域と、母標準偏差(ここでは母分布のRです)の推定域を求めるために使われます。管理図では母平均の範囲と母標準偏差の推計値及びその範囲を求めるために最大値と最小値の差(2本の場合にはそれらの差)、を利用しています。最大値と最小値の幅ではなく標準偏差を使う場合には、管理図と言います。
分布モデルに正規分布をあてはめていることによって、の範囲内にデータの95.5%、の範囲内にデータの99.7%が収まることが分かっています。これら推定域は、精度保証をするときの管理範囲を具体的に与え、その範囲内にあることを確認するために使われるわけです。
実際的なことを言えば、1本の精度管理試料を測定した結果に対する平均値が、この中心線に対して正負(上下)両側に均等に分布しているとき、測定作業が安定して繰り返されているということを表します。
管理図による精度管理は、現実の世界での精度管理試料を測定した結果を標本として、概念で与えられる母集団の分布に、その平均値の分布が従うことを利用し、得られた精度管理データの母集団への帰属を確認することで、精度保証を行うものです。ここでは、作業の面から100回分の測定を対象として話をしてきましたので、それを管理の対象として安定な作業が行われたことを保証します。管理の対象は、「ロット」と呼ばれます。管理図による精度管理では、そのロットに対して保証するのが決まりですから、ロットは予め決めておく必要があります。但し、ここで話したように100回というような切りのよい数字を使う必要は特にありません。
平均値でない単独のデータには正規分布モデルを単純に適用することはできません。どうしても単独のデータを使おうとする場合は、使おうとする精度管理試料の、対象となる成分に関する測定データが正規分布に帰属することをまず確認して下さい。
もし、経済上の制約で精度管理試料の測定がどうしても1日1回しかできないという場合には、1日1回測定の2日分、3日分のデータの平均値を使ってそのデータの母集団への帰属を確認するという手もあります。これは、推計学上目的に適っていて問題はありません。
何を目的に管理を行うか、という点が大変重要で、管理図による精度管理はあくまでも
'測定作業が始めから終わりまで安定して同じように行われていれば'、管理範囲内にデータが入る
と判定するものです。したがって、測定作業が精度上よくない可能性がある、と判断されたときにはどこに原因があるか素早く行動できる情報を提供することに主眼をおいた管理です。あるいは一歩踏み込んで、明日はダメが出るだろうと予測する情報を与えるので、予防的保守管理のために使われます。管理図による判定結果で検査値を補正したり、一つ一つの測定結果が正しくないと判断するものではありません。
篠倉 潔
(NTT西日本大阪病院 臨床検査科)
2003年6月24日