SOLUTION
検査室支援情報
精度管理の考え方
Q11 Answer
内部精度管理で、検体列にコントロール血清を入れる位置は、毎日ランダムに選ぶ必要があるのはどうしてでしょうか。決まった位置に挿入するのではだめな理由をお教えください。(大阪府 W.S.様)
コントロール血清の検体列への投入位置がランダムでなければならない理由は、臨床検査の品質管理のため、数理統計学上の手法を理論として使うからです。このことを少し詳しく説明します。
たとえば、内部精度管理には管理図法がよく用いられています。管理図法は視覚に訴える点で優れており、品質管理・精度管理は数理統計学の理論を応用する分野で最も成果を挙げた例です。この管理図法でのとは、周知の通りコントロール血清など精度管理に用いる試料を2回以上測定し、算術平均を求めたその平均値を指しています。臨床検査の測定作業を精度の面で管理するとき、私たちは分析結果を利用する人に対して、報告する結果が一定範囲内の精度にあることを保証しなければなりません。精度は正確さと再現性(精密さ)の2つです。
作業責任者は報告する結果が保証しようとする範囲内にあり、規格通り達成できているかどうかを確認するため、誤差の大きさを見積もる必要があります。つまり、報告する結果に対して、正確さと再現性が規定した一定の誤差範囲にあることを確認するのですが、誤差はまったくゼロということがありませんので、その大きさを知る必要があるのです。
このためにまず、利用する測定系であらかじめコントロール血清を多数回測定した結果から得られた、最も妥当だと考える濃度値に対して、保証しようとする正確さと再現性(精密さ)の範囲を決定しなければなりません。誤差が大きいと臨床情報として不都合になりますから、どの程度の誤差なら許されるのかを判断しておくことになります。コントロール血清を利用するのは、数週間から数ヶ月同じものを使用できる利便性を考えています。
許容できる誤差を見積もるとき、私たちは数理統計学上の手法を用います。やや長くなりますが詳しく説明しますと、私たちが保証する対象は、治療に際して所見を必要としている患者から採取した血液や尿に含まれている特定の成分濃度を計測した測定値であり、保証する意義はそれがどれほど信頼できるかということです。しかし、患者検体の成分濃度値はどんなものでも未知であり、1回の計測でどれだけ正確に測定できたかは容易に判断できません。そこで私たちは濃度が既知である試料に対して計測を行い、既に知っている値を根拠として、新しい測定を行う度に得られる結果をこれに照らし、計測作業全体が定められた管理状態下で行われたかどうか判断することを目論見ます。
濃度が既知である試料と書きましたが、初めて一つのコントロール血清を手にしたとき、その中に含まれる特定成分の濃度は患者検体と同様、どんなものであれ未知に違いありません。そこでこれを自施設の測定系で測定して濃度既知の試料としなければなりません。測定の作業がよく管理されていれば、反復測定によって得られる値はある値の周辺に出現することが予想されます。得られた測定値からその『母集団』を想定し、その母数を推定することで「真値」を決定する推計学の手法をとることにします。母集団を想定するというのは、確率の場を導入するということです。
『母集団』を想定しその母数を推定する手順として、コントロール血清に含まれるある成分濃度について、まず『コントロール血清に対する測定値の平均値』を得ます。具体的には同一のコントロール血清に対して反復測定で得た複数の値から平均値を求め、この作業を繰り返します。一つ一つの測定結果をそのまま使わないで、平均値を使う理由は自施設の測定系で反復測定した測定値の分布型を知らない場合でも、その平均値の分布は正規分布に近づくことが知られている*1のでこれを利用します。
*1: これは中心極限定理と呼ばれています。
ここでたくさん得られた測定値の平均値を一つのかたまり、すなわち一つの「標本群」として取り扱い、これから母集団の母数を推定します。ここで母集団を想定した理由として大切なことがあります。それは、推定によって得られた"母平均"をコントロール血清に含まれる成分濃度の「真値」と考えることです。実際の作業でコントロール血清を多数回反復測定した現実の測定値は、この真値に対する確率的な数値として表現されるものです。概念上の数値と現実の観測値に対する見方の変換は、大変重要なことですから正しく理解していただきたいと考えます。
このようにして予備的な実験で得た成分濃度の「真値」、すなわち母平均を精度管理上の目標値として利用することになります。
今ここで設定したことが、数理統計学を精度管理に応用するときの論理上の重要な根幹で、こう考えることにより実際の計測で得られる測定値が絶対のもので無くなります。つまり反復作業でバラツキのある値として私たちがその値を見ることになるのです。
管理基準としての範囲を設定することは、ある真値に対して実際の測定値が確率的に現れる範囲を限定する行為に他なりません。つまり、一つの母集団からランダムに一つの標本を選ぶとき、測定値があるモデル関数で表現される確率的な値なら、おのずからその関数で表現される出現範囲があります。私たちはこれを管理目標に応用することになります。
ところで再度確認しますと、私たちはコントロール血清のある成分濃度について、その真値を知ることが本来の目的ではありません。予備的な実験に引き続き行われる日常の実検体の測定で、コントロール血清をある指標として利用し、一つの測定系全体の精度管理をすることが目的であるはずです。つまり、私たちが考えているのは次のようなシナリオでした。
(1)予備的作業として、コントロール血清を多数回反復測定します。(2)得られたデータを使って母集団の母数を推定します。これにより示されるコントロール血清の真値*2とそのバラツキの範囲は一つの成分濃度測定について測定系の性能を表します。(3)測定結果を保証するとき、この性能が患者と検査技師の双方が満足できるものであれば、実際の測定にその測定系が使えると判断できます。(4)そこで、患者検体を測定することになります。同時に数本のコントロール血清をランダムに配置し測定を行っておきます。(5)コントロール血清に対する測定値の平均値を求め、これが先に設定したときの母集団と同じ母集団から取り出されたものであるかどうかの検定をします。(6)検定の結果、同じ母集団からの標本であるとされるなら、全体の作業が管理下にあったと判断します。
*2: 真値は絶対値からのバイアスを示すことになります。後述するキャリブレーションを参照。
測定系の作業全体がよく管理されていれば、一つの患者検体の測定作業はコントロール血清を予備的に多数回測定したときの一回の計測作業と同じように見なすことができるはずです。重要なことは私たちが管理するのは測定系の作業工程であり、それに使われる試薬や装置などであって、何を検体として測定しているのかはここでは問われません。
もしここで、コントロール血清をまったく測定せず患者検体だけにしてしまうと、予備的な作業をしていたときと同じ状態であるかどうか改めて確認をすることができないことはまったく明らかです。したがって、一つの大きな患者検体の群に対して数本のコントロール血清をランダムに挿入し、これらを測定します。つまり、患者検体の群の中に配置した数本のコントロール血清は、群全体がコントロール血清で、そこから数本を抜き出し標本として見ていることと同じです。このごく少数本のコントロール血清に対する測定値が予備的な作業を観察したときに得られた母集団と同じ母集団から抜き出したと考えてよいなら、作業工程すべてについて安心して保証を行うことができます。
重要な数理統計学上の考え方は、ここにあります。すなわち「予備的な作業と変わりなければよい」という表現は、新しい計測作業からの測定値が予備的なものと同じ母集団から取り出されたものと判断できるかどうか検定する、と言い換えればよいでしょう。母集団の概念を導入したとき、確率の場が導入されたことになり、新たなサンプリングによって母集団からいくつかの標本を抜き出して、それが真実同じ母集団の特性を反映すると想定するなら、それはランダムサンプリングでなければなりません。
付け加えることになりますが、コントロール血清に含まれていたある成分濃度について、精度管理に利用した真値(コントロール血清の母平均の推定値)と、通常で言う「神様のみが知っているであろう本当の真値」とは同じではないかも分かりません。もし、そこに差があれば、それはキャリブレーションの問題であり、それは計測系で予備的な作業をする前に解決をしておかなければなりません。
コントロール血清を測定したデータの平均値の母集団とは、検査室が臨床検査の利用者に対して保証しようとする『目標精度』を満足する測定値の無限集合です。一般的な『目標精度』の基準として、我々は分布の特性を数値で表現する母数のうち中央値もしくは平均値、また分布のバラツキを表現する標準偏差を利用します。
確率の場を導入したとき測定値の分布特性を明確にするのは当てはめる分布関数です。測定作業で実際に得られるのは、この分布関数で示される変数の一つです。このことを根拠として、新しく行われた測定によって得られたコントロール血清の測定値(反復測定の平均値)を検定します。検定は新しいデータが同じ母集団から抜き出されたものであるかどうかです。それゆえ検定に供されるデータはランダムサンプリングされていなければなりません。検定の結果により、対象とした患者検体群に対する計測作業は規格(目標とする精度)を満たしているとして品質を保証します。あるいは測定系の不具合を追究しなければなりません。
推計の手順を整理します。
- 一つの測定系で得られる測定値がある確率分布関数をモデルとして表現できるものと想定します。
- 実験をし、実際のデータを得て、想定したモデルが適応できるかどうかを判断します。
- 適応できるなら、精度保証する範囲をそのモデル関数から理論的に設定します。
- 作業仮説を、「新しい測定を実施して得られるデータは、先に実験で定めた分布をもつ同じ母集団から抽出されたものと見なせない*3」としておき、新しい測定を実施して、得られたデータに対しこの仮説の検定をします。
- 仮説が否定されるなら、保証する性能を満足しているとして、測定結果を報告します。
- この仮説が否定されない場合には測定作業が管理下になかったと判断することにします。つまり元の母集団とは異なる集団から得られたデータだと判断せざるを得ないわけです。この解釈は、母平均と異なる平均値を得たのでデータがシフトした、すなわち設定基準より値が高くなったか低くなったかを意味し、測定系のゆがみを示唆しています。したがって作業全体にわたって見直しが必要となります*4。
*3一般的に下で言う95%信頼範囲あるいは99.9%信頼範囲を逸脱した場合の判定です。
*4ただし、ある一つの測定結果が正しいか正しくないかの判定をしているのではないことに注意してください。
管理図法では平均値を使うことにした利点が活きてきます。平均値の分布を考えるとき、これによって母集団の分布型は正規分布が適応されます。正規分布はよく研究されている分布型で、その分布関数から、±1.96SDの範囲は母平均の95%信頼範囲、±3SDの範囲が母平均の99.9%信頼範囲を与えます。
つまり、実際に新しいロットが測定されるごとに配置される数本のコントロール血清の平均値は、反復作業がいつも同じように繰り返される限り元の母平均と違わないものであり、それゆえに元の母集団から取り出されたものと言えるかどうか検定します。繰り返して強調しますと、この仮説を検定するとき、確率の概念を導入した母集団を想定して行っていますから、利用されるデータはランダムな抽出によって得られたものでなければなりません。ランダムな抽出によらないデータは、確率論に従って仮説を検定するための条件を満足していません。
抽出された標本が各事象の起こりやすさ(今の場合はある値をとる確率)を正しく反映していることが重要な点です。そのためには全ての結果について抜き出される確率が同じでなければなりません。つまり、ランダムサンプリングでなければならないのです。
しばしば現場で見かけられる常に同じ位置から標本抽出を行うという方法は、サンプリングに偏りを生じさせる危険があります。したがって、精度管理を目的としたデータサンプリング、つまりコントロール血清をどこに置くかについて、注意深く設計しなければならないのです。
検体列からの標本の抽出がランダムとなるようにするためには、現在の自動分析システムでは人為的にコントロール血清の配置をランダムにする必要があります。
コントロール血清を検体列へランダムに配置するためのソフトを準備しました。是非ご活用下さい。
※マクロを有効にしてお使いください。
篠倉 潔
(NTT西日本大阪病院 臨床検査科)
2004年11月8日