SOLUTION
検査室支援情報
検査の樹 -復習から明日の芽を-
14-1. Carbapenemases LAMP法プライマー設計の奮闘記
1:プライマー設計への準備作業編
今日の遺伝子検査は次世代シーケンサーや高度な全自動多項目遺伝子解析装置および全自動核酸抽出装置などの導入に伴い、機器に組み込まれた技術に沿った広範囲かつ精密な分析が急速に展開している。分析担当者が分析構想を策定し、その成果を左右した時代からは大きく変貌しつつあるかに見える。しかし、機器の導入においては経済的および人的要因上から敬遠せざるを得ない施設も多い。また、そのような現状においても、検査室では臨床サイドからの強い要望に対処すべく新たな検査法樹立への模索も続いている。このような観点から、一歩なりともゴール到達を目指したいと強い探求心をお持ちの方、または、あえて用手的な方法論を追求せざるを得ない事情をお持ちの方々も多く居られる。まさに今、難解な現象に遭遇されている方がいるかもしれない。このようなときは、常に基本への回帰が早道のように思える。そのような理念の方にわずかでもお役に立てればと、私が初めて取り組んだLAMP法プライマー設計の悪戦奮闘を紹介する。
LAMP法は2000年、栄研化学社の納富らにより開発され、「Nucleic Acid Res.」に報告された方法である1)。LAMP(ループ媒介等温増幅)法は、標的DNAの6~8の異なる領域を認識する4~-6のプライマーを用い、 鎖置換型DNAポリメラーゼという独自の酵素による増幅合成を行う。FIP, BIPの2つのプライマーはループ構造を形成して増幅後のラウンドを容易にし、増幅効率を高める特徴を持つ(図1)。
図1 LAMP法におけるプライマーと反応機構の概略
Reprinted from www.neb.com (2018) with permission from New England Biolabs
https://www.neb.com/applications/dna-amplification-pcr-and-qpcr/isothermal-amplification
本稿ではLAMP法プライマー設計におけるいくつかの難儀した事項を述べるが、これは高塩基変異集団における各酵素バリアントに対応する網羅的プライマー設計を目指すためであり、通常の標的遺伝子でのLAMP法プライマーの設計はさほど難なく展開できることを最初に述べておきたい。
1 LAMP法プライマー設計のきっかけ
私は、PCRでのプライマー設計には、幾分かの経験は持っていたが、今回の設計に従事するまではLAMP法については全く経験がなかった。恥ずかしながらLAMP法の原理についても知識は曖昧だった。遺伝子検査への従事期間は長かったが、その業務の大半は遺伝子発現の定量やメチル化DNAの分析、サザンブロット、塩基変異解析など遺伝子増幅後のアプリケーション作業が主であり、遺伝子増幅を主体とするLAMP法とは縁がなかった。このような私に、2016年夏、国際医療福祉大学(大川キャンバス)の永沢善三教授から「今、微生物検査室ではCarbapenemaseの確定に困っています。まずは、Big Five(以下、「5.Carbapenemaseの本質を知る」にて説明)に限定し、これを同時にLAMP法のように安価な恒温機器でも簡易な測定操作で迅速に検出できる測定系を確立したいので協力してくれないか。」との共同研究の申し出があった。また、時を同じくして栄研化学社からも共同開発の申し出があり、3者での共同開発がスタートした。私は当初、Carbapenemaseについても充分な知識を持たず、LAMP法についての理解もないままであり、一抹の不安は感じながらも永沢教授の熱意に傾斜し、どうにかなるだろうと安易に頷いた。
2 プライマー設計、稼働はしたが…
当時は、現役を退き約8年間遺伝子検査から遠ざかっていた私の遺伝子検査に対する知識はぼろぼろの状態であり、あちこちに穴が空いた衣服のように腕を通せばビリビリと破けるような状態と比喩しても過言ではなかった。さらに追い討ちをかけたのは、DNA塩基配列の相同性比較などの編集処理法であった。現役時には、GENETYX, DNASISなどの市販ソフトを駆使していたが、今では高価なため公開のフリーソフトを使用する他なかった。これも当初、機能や使用法を充分に理解していなかったため、スムーズな活用ができず不便と思った。しかし、慣れると同時に若干の工夫も加え得るようになり、だんだん使い勝手も向上してきた。確かに、塩基変異が少ない遺伝子や少数の塩基配列を解析編集するには便利であるが、多くの塩基変異を含む遺伝子の多数の塩基配列を解析するには変異塩基のマーキングが無いなど作業上の不便さは感じる。
3 膨大な英語報文に足踏み
共同研究の開始と共に、次々と苦難な現実が来襲した。まずはCarbapenemaseの文献を調査すると多量の英語論文数が報告されていて、さらに、書籍や解説文などを含めるとその数は膨大な量となった。もともと語学に弱い私には、とても読破できる量や内容ではなかった。しかし、一編でも多く、Summary・Abstract だけでも目を通したいとの願望は増大した。ここで頼れるのは、「Google翻訳」しかなかった。ちょうどこの頃に、
「Google翻訳の精度を格段に上げる簡単な使い方」(徹底比較!英会話)
http://englishlands.net/google-translate/
「Google 翻訳の利用:PDFやWordのファイルを翻訳する方法」(東京経済大学 TKUメール)
http://google.tku.ac.jp/others/23/2
などの解説を見つけ、これらを参考に「Google翻訳」をフル活用し日々読解に没頭した2,3)。幸運なことに、これまで「Google翻訳」では意味不明な翻訳が多かったが、2016年10月から人工知能技術であるディープラーニング(deep-learning:深層学習)が翻訳サービスに導入された。これにより翻訳は飛躍的に向上し、現在も進化を遂げているがいくつかの課題は残っていた。例えば、細菌分野の文献では、菌種名をE. coliもしくはK. pneumoniaeと属名を略し、種名との間に1文字のスペースを入れ表記する。この、E.、 K. を文末と理解するのか、略属名と種名とを分離して訳してしまい文脈がおかしくなることがある。この場合、E.coli、K.pneumoniaeと1文字分のスペースを削除すると菌種名が連なって訳され理解しやすい。また、翻訳文章によっては、文末の認識が不明瞭なため意味が通じ難い訳文となることがある。この場合、英文末を用手的に改行すると訳文が分かりやすくなる。他にも、微生物の分野では「culture」培養→文化、「novel」新た、新奇→小説など独特の訳語があるが、これは使用しながら改善することが可能であった。また、長期間使用していると突然に、ロボットが壊れた図とGoogle「404. That’s an error.」が出て使用できない事態が発生する。この解決策は、ネット上にも多く示されている。私は、一度対処した後はネット検索履歴を頻繁にクリアすることで解決している。訳文は詳細な観点からは若干の課題も残るが、報告内容を理解するには充分である。
4 β-Lactamase、特にCarbapenemaseのデータベース探索
β-Lactamaseは、ペニシリン、セファロスポリン、モノバクタム、およびカルバペネムと多くのβラクタム系薬剤を加水分解し不活化する酵素の総称である。特に、カルバペネムクラスの薬物分子を不活化する酵素をCarbapenemaseと呼ぶ。
文献を読み進めていくうちに、Carbapenemase測定における本質が漠然と見えてきた。分析上の課題は、family内のバリアントの多さと塩基変異の多様性でした。本来、LAMP法のプライマー設計は、フリーソフトとして提供されているプライマー設計ソフトウェア(PrimerExplorer V5)を活用すれば比較的容易と聞いていたが、Carbapenemase分析プライマー開発の進展が遅れている理由には、PrimerExplorerにかけるまでの作業、すなわちmultiple DNA sequence alignment結果の多様性と、そのことによるPrimerExplorer作業の複雑性に起因することが推察された。当時、Carbapenemase酵素Big Fiveを個々にLAMP法で検出する論文はすでにいくつか報告されていたが、Big Fiveを同時に同じ反応温度で検出するものはなかった。また、内容的にもfamily内の高塩基変異バリアントが報告される以前にプライマー設計され、網羅的プライマーとしての観点からは、反応性に疑問を抱くものもあった。
このため、文献読解と同時に、まずはCarbapenemaseの総合的なデータベースサイトを探索した。データベースの内容的充実性と正確性、さらにはデータ更新の迅速性、利便性などを備えたデータベースサイトをいくつか絞り込んだ。この中で、Beta-lactamase database(BLDB):http://bldb.eu/は、Enzymes, Structures, Mutants, Kinetics, BLASTと区分化され、内容もさることながら最新情報が実に合理的に集積されている4)。図2には、Enzymesの項目からIMPの一部を示した。
図2 Beta-Lactamase DataBase :BLDB (http://bldb.eu/)/Enzymes/IMPの画面
BLDBホームページによると『(BLDB)の目的は、現在知られている全てのβ-Lactamaseに関する配列情報ならびに生化学的および構造的情報をコンパイルすることである。 BLDBは、β-Lactamaseを分析するためのツールを提供し、関連する重要なウェブリソース(NCBI, PDBなど)へのリンクを提供する。 毎週更新されるこの包括的なウェブベースのデータベースは、β-Lactamaseの構造 - 機能に関係する有用な洞察を提供し、基質特異性のより良い理解を可能にし、基質認識に関与する重要な残基を決定する。さらには、加水分解プロフィールにおける突然変異の影響を知るために使用される。』と記述されている。以後は、BLDBを主体的データベースとして活用した。
5 Carbapenemaseの本質を知る
BLDBの情報で驚くのは、β-Lactamase酵素数の多さと塩基変異の多様性である。私も数十年前までは微生物検査に従事していた関係上、β-Lactamase酵素に関しては幾分かの見識は持っていたが、今日の想像を超えた多様性には驚いた。今回はプライマー開発目標をCarbapenemaseに限定し、中でもBig Fiveとして5大猛獣(ライオン:NDM、ヒョウ:VIM、サイ:IMP、バッファロー:KPC、ゾウ:OXA-48-like)に例えられているNDM, VIM, IMP, KPC, OXA-48-likeのみと限定したために、その範疇は幾分か狭められた。しかし、各々のバリアント数と多様性は表1に示すように極めて多様である。中でも VIM, OXA-48-likeさらにIMPは突出している。また、BLDBのデータは、月に一度くらいは閲覧しないと新しいバリアントの追加削除などによる更新に追われる。
表1 Carbapenemase(Big Five)のバリアント
このような現況の中、大切なことは、ターゲット遺伝子のDNAシーケンスを堅実に調査集積することである。今回の最終目的は、Carbapenemase酵素Big Fiveに限定した遺伝子のLAMP法プライマー設計にある。まずは、本酵素群各familyのバリアントの塩基配列データ全てを集積し解析することである。文献や、前述したBLDBなどのデータベースを参照し、GenBank IDから塩基配列データを集積した(FASTA(ファストエー)形式でWordPadに集積する)。今回は作業上の都合から2017年2月末日までにアップデートされたデータを用いた。
6 Carbapenemase DNAシーケンスデータの集積と解析
BLDBなどのデータベースを基に、NCBI(National Center for Biotechnology Information)のGenBank:https://www.ncbi.nlm.nih.gov/genbank/から各familyの各バリアントの塩基配列データを取得し、集積編集後に、各々の塩基配列の相同性や特性を比較した。各familyの特性をつかむため、まずは集積した塩基配列データのAlignment処理を行った。DDBJ (DNA DATA Bank of Japan)のclustalW:http://clustalw.ddbj.nig.ac.jp/に集積したDNAシーケンスデータを入力し解析を繰り返した。DDBJの利用法の詳細については以下に述べられているので参照されたい。
『DDBJ利用の手引き』(DDBJ センター)
http://www.ddbj.nig.ac.jp/ddbjingtop-j.html
『clustalWヘルプ』(DDBJ センター)
http://www.ddbj.nig.ac.jp/search/help/clustalwhelp-j.html
集積した塩基配列データの形式・形態などが解析ソフトに対応可能な形式かを検証するため、予備的にデータを流し込み検証した結果から、塩基配列データはFASTA形式とした。
これらの作業を確立した後はひたすら、データベースのGenBank IDからCarbapenemase family各々のバリアントの塩基配列データを流れ作業的に取得した。データはWordPadにFASTA形式で、リッチテキスト形式(RTF)で集積した(図3)。
図3 IMP各バリアントのDNA Sequenceファイル例(WordPad:FASTA形式)
7 DNAシーケンスデータ集積に活用すると便利な情報
集積作業で留意すべきことは、①バリアントによってはバリアントNo.が記載されていないものがあるのでその場合は、例:>・・・・・・・・・・・・(例:blaIMP-8)とFASTA形式の文字列最後尾に記入しておくと後々都合よい。ただし、最後尾が改行しシーケンスデータ文頭に掛からないように注意する。②まれにバリアントによっては逆鎖が記載されている場合がある。Alignment処理した結果が、他のバリアントの塩基配列と比較して極端に相同性が低いバリアントについては、相補鎖変換して再度Alignment 処理してみる。または、「ATG」の開始コドンが塩基配列データの先頭部にあることを確認する。
③これは、処理後に気付いたことであるが、Alignment 処理後の一覧では、GenBank IDなどのFASTA形式の前の一部の説明文しか表記されないため、データ比較時にバリアントNo.が分からず、難儀することが多い。この対策としては
『>AJ243491.1:539-1279 Acinetobacter baumannii partial intI1 gene and blaIMP-2, aacA4 and aadA1 genes
ATGAAGAAATTATTTGTTTTATGTGTATGCTTCCTTTGTAGCATTACTGCCGCGGGAGCGCGTTTGCCTG・・・・・・・・・・・』を
『>blaIMP-2 AJ243491.1:539-1279 Acinetobacter baumannii partial intI1 gene and blaIMP-2, aacA4 and aadA1 genes
ATGAAGAAATTATTTGTTTTATGTGTATGCTTCCTTTGTAGCATTACTGCCGCGGGAGCGCGTTTGCCTG・・・・・・・・・・・』と
>の文頭に加筆しておくと、Alignment結果の先頭に表記されるため、バリアントNo.が分かり塩基変異の多様性などが理解しやすく、作業も容易である。 ④GenBank IDが直接Carbapenemase遺伝子のみの塩基配列を限定したものではなく、報告されたplasmidなどの長い全構成遺伝子を指していることがある。このときは根気強くCarbapenemase遺伝子を探し出す。また、⑤データが多くなってくると、つい流れ作業的に処理してしまい、誤って同じ配列データを重複して集積していることがある。この場合Alignment処理でエラーが出るなど、いくつかの工夫と注意が必要である。シーケンスデータの集積作業を終えたら、次は本格的なMultiple Alignment処理である。
8 PrimerExplorer V5模擬使用での失敗談
Carbapenemases family各バリアントの塩基配列データの集積を進めながら、データ集積終了後に作業が滞ると厄介なため、いくつかのデータを集積した段階で模擬的にLAMP法のプライマー設計ソフトPrimerExplorerに塩基配列データを入力し、実務作業の確認を試みた5)。ところが、PrimerExplorerのターゲットファイルに塩基配列データを読み込めなかった。何回か繰り返しても結果は同じであった。理由は簡単で、恥ずかしながら私の初歩的な勘違いだった。このソフトでの読み込み可能なフォーマットは、①テキスト形式、②FASTA形式、③GenBank形式、④マルチプルアライメントファイル形式、⑤ターゲット配列保存ファイル形式となっているのに、私は塩基配列のAlignment処理後のデータを深く考えずに「Word」へ書き込んでいた。「Word」には、リッチテキスト形式(RTF)、OpenDocumentテキストがある。これらを利用可能なテキスト形式と勘違いし「Word」でデータを読み込ませていた。ここで初めて、現役時代の作業内容を思い出した。メールで担当者に確認したところ、この勘違いは意外に多いとのことであった。WindowsでPrimerExplorerにデータを読み込ませるには、メモ帳(テキスト文章(*.txt))やWordPadなどがテキスト形式を持つソフトとして利用可能である。その後は、目下WordPadのテキストドキュメントを使用している。WordPadには、他にもリッチテキスト形式(RTF)、OpenDocumentテキスト、テキストドキュメント-MS-DOS形式、Unicodeテキストドキュメントがある。データ集積に特殊ソフトの使用を予定している場合は、読み込み可能な形式かを事前に確認しておく。また、Windowsのメモ帳からの読み込みも可能であった。
2018.11