SOLUTION
検査室支援情報
精度管理の考え方
Q2 Answer
すでに設定されている基準範囲の妥当性を再確認するにはどうすれば良いでしょうか?(神奈川県 K.Y.様)
臨床の現場では、ある患者から得られた臨床検査の結果は、適当な基準に照らして解釈され、被検者に対して診断がつけられたり、治療の方針が決定されたりします。
こうした場合に利用される基準は、「基準範囲(Reference range)」とよばれ、もっとも頻繁に使われるのは、ごく一般的な日本人の成人男女に対する正常値です。現在は「正常」という用語をきらい、「健常」という用語に改められて、「健常値」と言われています。用語では、健常値としてあたかも一つの値のようですが、基準範囲、と上でよんだように、たいてい上限と下限で与えられた「幅」を指しています。もちろん上限か下限だけが与えられる場合もあります。
単に健常値とよばれているものでも、臨床検査結果解釈のための基準として用いられる場合には細かな考え方の違いがあり、一意的に健常者だけを選別するものではありません。たとえば、次のようなものがそれです。
- 多数の健常成人の検査結果を統計処理し、高値側と低値側の2.5%ずつを除外した残る95%を含む範囲(これがいわゆる健常値です)
- 主として疫学調査による解析から、臨床検査と特定の疾患との関係を考慮し、この範囲を越えるものを要治療と決定するための判別値(例:動脈硬化学会が勧告している血清コレステロールの限界値など)
- 特定の病態において増加または減少する血液成分について、その原因に対する検査の感度と特異性を考慮し、臨床的に陰性と判別するために設定した値(例:腫瘍マーカーなどのカットオフ値など)
それぞれの範囲が意味するところは少しずつ違っています。情報を得たい被検者の状態に対して、それを表現する上ですべてが単純に「健常である・ない」と断定するものではありません。
たとえば現在多くの国際的な糖尿病関連学会の勧告は、空腹時血糖値で7mmol/l以上という濃度を被検者が糖尿病であると肯定し、これに対しなんらかの治療を開始すべきである値としています。しかしながら、その濃度より低い血糖値を示した場合でも糖尿病を否定し、健常であることを単純に肯定するというものではありません。5.5mmol/lという濃度が健常者の上限として別に与えられています。空腹時血糖値が7mmol/l以上であるということは、あくまでもある治療が開始されるべきかどうか判断する基準です。
このように、正常な状態と異常な状態の判別基準、異常である場合の加療の必要性の判断基準、と同じ『基準値』と呼ばれていても意味が違う場合があります。
そこで、質問者の使われている「基準値」あるいは「基準範囲」ですが、健常者を対象としてある幅を設定し、ある患者の検査結果を解釈する際に参照するものという一般的な意味での健常値を指されているものと考えます。
現在、健常者に対して基準範囲を求める場合に、もっともよく利用される勧告は次のものです。
How to Define and Determine Reference Intervals in the Clinical laboratory: Volume 20; NCCLS: C28-A2 [もし必要ならCLSIより購入して下さい]
ところで、一般に基準範囲を求めるときには、次のようなステップによって行われます。
- 基準とする対象を任意に規定する(健常者を対象とするなら「健常」という定義を規定します)
- 規定した条件を文書化し、対象を適切に選別するための質問票を作成する
- 基準範囲を求めるに際し必要な倫理上の届け出をし、承認を受ける*
- 基準範囲を求めるため、ボランティアを募集し、彼らの同意を求める
- 測定方法を規定する
- 測定方法のトレーサビリティを確認する
- 精度管理基準を設定する
- 検体採取法(採血条件・採血器具・採血手技・検体輸送法ならびに保管法)を規定する
- 測定を実施する(すべての検体が同一条件で測定されたかを保証する精度管理記録を添付する)
- 統計処理法を決定する
- 統計処理を行う
*ボランティアに対するコンセンサスは、次のような参考文献があります。
- 世界医師会(WMA) ヘルシンキ宣言:ヒトを対象とする医学研究の倫理的原則
( 原文: http://www.wma.net/en/30publications/10policies/b3/index.html) - 世界医師会(WMA)ヘルシンキ宣言:ヒトを対象とする医学研究の倫理的原則 日医雑誌:125;364-367, 2001.
- 世界医師会 :ヘルシンキ宣言 ヒトを対象とする医学研究の倫理的原則(解説) 臨床評価:28(3);527-530
- 立花勇一 :ヘルシンキ宣言 ヒトを対象とする医学研究の倫理的原則(解説) 医学検査:50(5);705-708
- 藤野昭宏: 医学研究における余剰生体試料の利用に関する倫理判断基準(解説) 生命倫理:12(1);92-98
たとえば、「健常者」というものを対象として「健常値」を求めようとする場合には、「健常者」について定義しなければなりません。この定義は任意ですが、極めて明確に文書化されたものにすべきで、第三者がそれを正しく解釈できる必要があります。
血清中性脂肪を例にしますと、よく知られているように、それは食事の影響を大きく受けるため、被験者が採血時どのような状態にあるかを厳密に規定する必要があります。また前日にアルコールの摂取があると血清中性脂肪は高くなると言われますが、アルコールの影響には個体差があります。あるいは厳密に12時間以上絶食すべきだという人があります。しかし健常者が12時間以上絶食するのも考えようによっては奇妙です。もちろん、食後5時間程度は摂取した食餌の影響をはっきり受けますので、常識範囲では朝起床してすぐの採血がよいでしょう。とはいえ、採血を実際行うという作業を考えると、ボランティアの早朝採血というのは大変な困難を想像します。こうしたことを考えれば、健常値を求めようとする者が、任意に定義する「健常者」がどのようなものであるのかは、極めて明確でなければならないことが理解されるでしょう。どんな状態の被験者を対象としてデータが集められたのかは、そのデータを利用する者にとっては不可欠な情報です。
対象とする群について、性(女性の場合には生理に関することも含める)、年齢、身長、体重、生活習慣などの選別基準は、慎重に決定する必要があります。しかしながら、医学とそれに関わる技術は今日急速に進歩しているため、遺伝性素因についての配慮などは、対象を規定する上でおよばないものがあることも知らなくてはなりません。基本的なことでは次の文献が参考になるでしょう。
- 桑 克彦: NCCLS指針による基準範囲の算出要領.メディヤサークル 40:429-442,1995
- 市原 清志: 基準範囲の設定における基準個体の選別・統計処理上の問題点と対応.
- 臨床検査 40: 1383-1392,1996
測定法の規定も厳密でなければなりません。再現性(精密度)に関して2%の誤差で測定を実施するのか、5%の誤差で測定を実施するのかでは得られた分布のシャープさ(精密度)は大きく異なります。また、測定者がバイアスを知っていなければ、データを利用しようとする者にとって、そのデータが標準化されたものであるかどうかが不明で役に立ちません。
得られたデータをどのように統計処理をするかについても同様に厳密でなければなりません。しかし、間違った分布モデルを適用したり、計算過程で紛れ込む誤差への配慮がなおざりにされがちです。厳密な計画の下に得られた測定値に対しおおざっぱな計算処理をしたのでは調査計画の意味をなしません。
さて、健常値について、その利用のされ方について、いったいどのような意図があるのかも改めて考えてみる必要がありそうです。
日本人成人男女の健常値と単純によぶ場合に、私たちはあたかもそのような母集団の存在を仮想しています。そこには健康な日本人が無限にいて、その全体の分布のようすを数値で表現するために、母平均値と母分散を使おうとするのです。しかしながら、仮想していただけでは実際の計算ができませんから、実在の健康な日本人を対象として得られた測定値を統計計算に用います。測定に協力した実在の健康な日本人は、その母集団からランダムに抽出した「標本」と考えます。
「標本」は、我々が概念で持つ仮想の母集団を具体的なものにするという重要な意味があります。健康な日本人標本から得られたデータを使って母集団の分布を推測します。別の個体から得られたデータを、その分布に照らして同じ母集団に属するかどうか判断するには母集団に関するデータを知らなくてはいけません。同じ母集団から得られた標本とは言えない、と判断されることは健常者ではないことを示唆しているために、医療の提供者と本人は大いに関心があるはずです。また、このとき推論をしているので、どれほどの確からしさで判断しているか数学上の規定を設けておきます。
もう一度注意して考えてみましょう。
ここに健常な日本人がいて、その人を観察すると生理的に変動する、ある血清成分が存在することを私たちは知っています。さらに、別の健常な日本人がいれば、その人にも生理的に変動する同じ血清成分が存在します。こうして個人において変動している血清成分の濃度は、多数の同じ定義で規定される日本人それぞれが変動しているでしょうから、バラツキがあって個別に変動する多数の個体を一つの群としてとらえようと目論むことになります。
また、測定の作業にも、ある変動(バラツキ)があります。一列に並べた血液検体はすべてが厳密に同じ精度で測定されているとは言えません。正しく精度管理されていれば、全体としてあるバラツキの幅にあることが理解されますが、一つ一つの血液検体の測定精度は知り得ません。
こうして常に変動している成分濃度に対して、ある一瞬のデータを標本として得たとき、私たちはそのデータの分布からどんなことを学ぶことができるのでしょうか。
先ほど、無限にいる健康な日本人を仮想的な母集団とする、と書きましたが、得られる標本データを使ってこの母集団を推測するのは、大変意義のあることに違いありません。しかし、これをどう解釈するかということには十分な論議が必要です。
一般に、標本数nの標本から得られた標本の平均値を 、標準偏差をsとして、次の範囲が計算されます。
・・・式(1)
この範囲が教えることは、母集団の平均値を推測するとき、その母平均がこの範囲内に95%の確からしさで存在するということです。
もちろん、この95%の確からしさを言おうとすれば、計算の根拠となる分布モデルに通常では正規型を利用しているでしょうから、その場合には標本データの正規性を言っておかなければなりません。血清中性脂肪は対数正規分布型であることがこれまでの調査で知られていますので、標本データは対数変換されたものが使われているでしょう。
話を戻して、私たちは仮想された母集団の平均値がどんな値を持っているのかを知りたいわけではありません。正規型の分布をしているなら、それを中心として95%のものが含まれているだろう範囲を推定したいと考えています。健常者が95%含まれている濃度範囲を知るという意味です。そこで、正規分布についてよく知られている95%範囲を計算する式(2)を利用します。
・・・式(2)
※ULは上限、LLは下限を意味します。
ところで、この2つの要求は明らかに論点が違っています。それらは、仮想された母集団の平均が存在する推定範囲と、仮想された母集団のうち95%の個体が含まれる濃度範囲です。
質問を整理し直してみましょう。
ある血清成分について「与えられた健常値」があり、次からの被検者に対し、その同じ血清成分を同じ測定法で測定したデータがこの範囲内にあった場合となかった場合に分け、そうしてふるい分けたものの5%だけがその範囲を外れていれば「与えられた健常値」は妥当だと言えるのでしょうか。
たとえば、こう考えてみて下さい。ある範囲を設定する際、対象とする母集団の95%が含まれているようにしたと主張するのは、20人に1人の割合で母集団に含まれる個体を排除したと主張するのと同じです。排除されるものがランダムに選ばれるなら、上限を越えるものと下限を越えるものは均等に出現します。こうして考えるなら、やはりある程度数学的に考えて、元の分布を推定して検討をするのがよいでしょう。
そこで、もし手元に由来の明らかな新しいデータ群が入手できたとき、旧来の健常値を計算する根拠となった分布と比較し、それらが同じ母集団からランダムに取られたものかどうかを判断することを考えてみましょう。
先に述べましたように、多くの血液成分の分布は対数正規分布型です。そこで、旧来の健常値上限と下限を使って次の値を求めることにします。もちろん分布の特性値が分かっていれば次のステップは省略できます。
2つの分布型を調べるのに、分布の特性を表すモーメントのうち、平均と分散を使うことにします。
旧来の健常値上限値をUL、旧来の健常値下限値をLLとして、その健常値を求めただろう群の標本平均を 、標準偏差を とします。もちろんその群について多くのことを知り得ないということで、ここで仮にこうしておくのです。健常値を求めるために、標本の値が対数変換されていると考えているので、その変換後の標本平均をm、標準偏差をdとすると、ULおよびLLとmおよびdとの関係は、一般に基準範囲は分布の95%幅とされる例に倣って、式(2)と同様に対数変換後の標本平均mと標準偏差d を使い、次のように表されます。
- UL=m+1.96d・・・式(4)
- LL=m-1.96d・・・式(5)
この値を通常の検査値に戻すには指数を取らなければなりません。つまり、対数変換された結果の数値bが数値aに由来するなら、数学的にb=ln(a)と表され、この関係から、a=ebとなります。(記号lnは自然対数logeを意味しています)
今は分布の計算結果としてm+1.96dは対数変換されたもので、これを戻してULとして表現しているだろうと考えます。すなわち、b=m+1.96dと考えれば、元のデータの単位で表される数値は、e(m+1.96d)となります。
中性脂肪を例に考えますと、健常値が50~130mg/dlであれば、
UL=130; LL=50で、対数変換をした計算の結果では、ln(130)=4.8678とln(50)=3.9120です。
再び記号で計算をしますと、式(4)と式(5)をそれぞれ足したものと引いたものから次の関係式を得ます。
・・・式(6)
・・・式(7)
元のデータの標本平均 と標準偏差
は、対数変換されたデータの平均と標準偏差を使って次式のように表されます。
・・・式(8)
・・・式(9)
以上のようにして、先の中性脂肪の例では、平均83.06 mg/dl、標準偏差20.57 mg/dlと計算されます。
こうして得られた「今与えられている健常値」を算出する元になった平均値、分散と、その妥当性を検討するために新たに標本を測定して得た平均値、分散とを比較・検定するには次の手順で行います。
<平均値の検定>
現在設定されている基準範囲を算出する元になったデータの平均値をμ、標本の標準偏差をs、標本数をnとすると、危険率5%で標本平均の臨界値は
上方限界=
下方限界= となり、
標本平均が上方限界より大きいか、下方限界より小さければ元のデータの平均値と標本平均に差があると判定され、標本平均が上方限界と下方限界の間であれば元のデータの平均値と標本平均に差があるとは言えないと判定されます。
<標準偏差の検定>
現在設定されている基準範囲を算出する元になったデータの標準偏差をσ、標本の標準偏差をσ0 、標本数をnとすると、危険率5%で標本標準偏差の臨界値は
- 上方限界=
- 下方限界=
となり、
標本標準偏差が上方限界より大きいか、下方限界より小さければ元のデータの標準偏差と標本標準偏差に差があると判定され、標本標準偏差が上方限界と下方限界の間であれば元のデータの標準偏差と標本標準偏差に差があるとは言えないと判定されます。
なお、 、
は、それぞれ自由度m=n-1の
分布の2.5%有意水準、97.5%有意水準を表しています。
こうして標本の平均値と標準偏差が現在設定されている基準範囲を算出する元になった平均値と標準偏差とに差があるとは言えないと判定されれば、現在の基準範囲にズレがあるとは言えず、妥当なものであると判定できます。
篠倉 潔
(NTT西日本大阪病院 臨床検査科)
2003年8月5日