ゲノム医療特論

ゲノム医療総論

現在ではゲノムシークエンス技術の発達により個人の遺伝子ゲノムを解析することが可能になりました。そして、それぞれの癌は何らかのがん抑制遺伝子、特にドライバー遺伝子の異常によって発症します。よって、癌を含んでいる組織から遺伝子を抽出し、遺伝子の異常個所を発見することができます。治療薬の選択は癌の臓器部位に関わらず、原因となる異常遺伝子ごとに行う方が、治療効果が有効であることも明らかになっています。これを分子標的薬によるがんの個別化治療と言います。

 

但し、全ての遺伝子異常と治療薬の選択についてエビデンスが確立しているわけではありません。よって、各専門家との協議と患者の同意の下に治験として治療を行うこともあります。そして人工知能(AI)がこのゲノム医療の研究に役立つことが期待されています。AIが文献データベースの自動アップデートや新たなドライバー遺伝子やバイオマーカーの発見、遺伝子発現の予測を促進することが期待されています。

脳神経内科領域における臨床遺伝診療

医療における遺伝子関連検査としては、肝炎ウイルスやHIV、結核等の病原体遺伝子(核酸)を検出する検査、白血病等の出生後に起こる後天的な遺伝子変異に関する体細胞遺伝子検査、そして生涯変化せず子孫にも伝わる遺伝性疾患に関する生殖細胞系列変異を調べる遺伝学的検査があります。

 

最後に分類される生殖細胞系列変異は個人に固有であり、一生変化せず、血縁者で共有し、差別の危険性が最も高く、予期していないことが多いのでプライバシー保護、慎重な検査と診断、被験者のメンタル支援が非常に重要となります。他方で現在では、遺伝性疾患に対する根治療法が急速に発達していることから、遺伝子疾患の早期発見、早期予防、早期治療も大切です。

 

但し、未知の遺伝性疾患も未だ多く、臨床的に特異な兆候、病理学的に未知の所見、既知の遺伝子変異の不在の証明を要します。この場合に原因遺伝子を特定することが非常に困難で人工知能(AI)の役割が期待されています。

バリアントの病原性評価と遺伝カウンセリング

生殖細胞系列変異の検査を行う際には遺伝子カウンセリングが特に必要となります。遺伝学的検査では予期しない情報、特に本来の診断目的とは別の遺伝子変異が見つかる場合があります。このような二次的所見については、臨床的に確立した治療法や予防法が存在し、患者本人や血縁者の健康管理に有益で、病因として確実性の高い変異(バリアント)の場合に開示が推奨されています。これらの遺伝子はACMG(American College of Medical Genetics and Genomics)recommendationsで指定されています。但し、開示の希望の有無を検査前に確認する必要があります。

 

特に開示が指定されていないバリアントの病原性についてはデータベース又はACMG-AMPスコアリングを利用して評価します。バリアントについての血縁者間での情報共有についても段階的かつ継続的に検討します。人工知能(AI)はバリアントについてのデータ収集やリスクアセスメント等で役立つことが期待されています。

がんゲノム医療とAI

現在癌ゲノム医療においても人工知能(AI)の役割が増大しています。特に遺伝子変異から癌の診断、分類を非常に高い精度で行うことができます。つまり遺伝子を調べることによる癌の早期診断が可能になりました。又、AIを利用して病理画像から腫瘍細胞の割合を評価することもできます。AI技術の進歩により、病理専門医と同等の精度で腫瘍細胞を検出することができます。

 

このようなゲノム医療を行うためには、大量のデータの蓄積と分類が不可欠です。更にそれぞれの患者において、全ての変異遺伝子から癌の原因となるドライバー遺伝子や薬剤の標的となる変異を見つける必要があります。このような過程にはビッグデータとAIが不可欠であり、その上で専門医が結果の解釈や判断を行う必要があります。

 

ビッグデータとAIの登場によって薬剤開発の方法論にも変化が生じ、患者個人の特徴に応じた治療を行うPrecision Medicineが主流になりつつあります。

病理医の立場からのがんのゲノム医療

染色体異常は同一染色体内で起きる欠失、重複、逆位と異なる染色体間で起きる挿入と逆位に分類されます。遺伝子異常はコドン内の塩基の置換、欠失、挿入によりアミノ酸の変異が生じるミスセンス変異、アミノ酸のコドンを終止コドンにするナンセンス変異、そして塩基の挿入、欠失によってアミノ酸のリーディングフレームがずれるフレームシフト変異があります。

 

正常ではこのような変異に対しDNAを修復するメカニズムが存在し、塩基除去修復、核酸除去修復、ミスマッチ修復、又は二重鎖切断修復が行われます。この修復メカニズムが失敗したときにドライバー遺伝子として癌化の可能性を引き起こします。よって現在では癌に対して臓器別よりむしろドライバー遺伝子ごとに治療法を選択します。

 

但し、癌細胞も薬剤に対する耐性を獲得するメカニズムを持つため治療薬の選択も複雑です。そこで、形態診断から遺伝子解析を行い、治療法を選択するために、人工知能(AI)の一種であるサポートベクターマシンを利用することがあります。

ゲノムとAI

癌の遺伝子変異には、翻訳領域内の変異による過剰活性の変異タンパク質を普通量生産するもの、遺伝子増幅による正常タンパク質を過剰生産するもの、染色体再構成による近傍の調節DNAが正常タンパク質を過剰生産させるもの又は活発に転写される遺伝子と融合し、過剰活性の融合タンパク質を生産させるものに分類されます。

 

他方で癌の抑制遺伝子の変異では、原則として両親双方の遺伝子変異により癌が発症します。但し例外として、正常な染色体の完全な喪失、正常遺伝子を含有する領域の欠失、正常遺伝子の機能欠損変異やエピジェネティック疾患による遺伝子活性の抑制の場合には、片方の遺伝子変異のみにより癌化が発症します。

 

全ての遺伝子変異により病気が発症するわけではなく、変異(Variant)の病的意義は既存のデータベースや論文情報に基づいて判定します。このような情報がない変異をVUS(Variant of Unknown Significance)と言います。この新たな病的意義を発見するために様々な人工知能(AI)が使用されます。

医療ビッグデータとAI

現在では患者、特に癌患者の遺伝子と正常遺伝子を比較し、癌の原因となっている遺伝子変異、特にドライバー遺伝子の探索とこれに対する治療薬の発見が行われています。全ての遺伝子異常とこれに対する治療法が確立されているわけではありませんが、それぞれの癌患者のドライバー遺伝子、つまり最も関連性のある遺伝子変異を特定し、過去のエビデンスに基づいて有効と思われる薬剤を投与します。条件によっては保険診療の適用や企業からの資金援助が可能となります。

 

但し、原因となる遺伝子変異の特定は簡単ではなく、治療薬の有効性も様々な遺伝子の変異の組み合わせや病理所見、放射線画像所見、血液検査所見等に依存します。よって有効な治療薬の探索には様々な種類の医療ビッグデータを構築し、解析することが必要です。この解析には人工知能(AI)が必要となります。現時点における医療ビッグデータとAIの活用に関しては、電子カルテの活用やプライバシー対策等数多くの課題があります。

ゲノムとAI2

現在では遺伝子解析に人工知能(AI)が使用され、特に次元縮小法、予測モデル、機械学習、正則化法やマルチオミクスが使用されます。次元縮小法の中で最も一般的な手法は主成分分析(PCA)で軸の回転や行列分解を行います。予測モデルでは主に、教師付き機械学習が行われ、遺伝子発現値と患者のサブタイプの関係を解析します。決定木、ランダムフォレストやロジスティクス回帰が代表例です。ランダムフォレストでは変数重要度が付属しています。

 

遺伝子解析においては遺伝子が予測変数となります。但し、全ての遺伝子を予測変数に使用するとモデルが訓練データに過適合してしまいます。よってバイアスと分散のトレードオフを考える必要があります。又、正則化法によりモデルの過適合を防止することも可能です。

 

今日では同じサンプルからRNA-seq、DNA-seq、BS-seq等の多次元オミクスデータセットを得て、mRNA転写、DNAメチル化、突然変異や遺伝子発現等を解析することも可能です。

臨床遺伝学・ゲノム医療と医療倫理

遺伝子は生物の特徴の多様性を生み出します。メンデルの遺伝の法則には優劣の法則、分離の法則、独立の法則があります。そしてこの法則に基づく遺伝病も存在します。常染色体優性遺伝病では一般に軽度なものが多く、突然変異、生殖適応度、浸透率と性腺モザイク、表現度、共優性遺伝に依存します。常染色体劣性遺伝病は頻度が低いものの、重症化することが多く、遺伝的複合や片親性ダイソミーにより発症することもあります。X連鎖劣性遺伝病では男子で発症し、女子は保因者となることが多いです。X連鎖優性遺伝病では、女子で発症し、男子で重症化することが多いです。非メンデル遺伝病では母性遺伝のミトコンドリア遺伝病、多因子遺伝病、染色体疾患、エピジェネティック疾患があります。

 

遺伝情報は生涯不変性、血縁者間の共有性、将来発症の予測性、疾患発症の曖昧性、検査の容易性という特徴を有し、健康管理に役立つと同時に、プライバシー保護や差別防止の問題を含みます。人工知能(AI)搭載のチャットボットを使用することにより遺伝病患者のスクリーニングや基本的な遺伝教育を行うことができます。

ゲノム医療と社会医療情報基盤の変遷

ゲノム医療の前提として生命情報の集積と利用ができる環境が必須となります。このデータベースはバイオバンクと言われ、DNA等の検体と検体に関するデジタルデータを同時に含みます。そして検体を保持するための冷凍保管庫とデジタルデータを保持するためのメモリーが必要です。

 

更に、ゲノム医療に必要な基盤情報インフラ要素として、1情報の共有、交換、有効利用のための標準化、2個人情報保護のための情報セキュリティ、そして3トランスレーションリサーチ情報基盤が必要です。

 

情報の標準化とは、名称、記載方法、順番やファイル形式等を統一することにより、それぞれの組織間における情報の共有、交換を簡易化し、統一化されたデータベースとして利用することです。現在では医療情報の国際的な標準化が進んでいます。

 

現在では故意又は過失による個人情報の侵害が増加しており、個人としても医療機関としても重い刑事、民事そして行政責任を負う可能性があります。情報セキュリティ対策の重要性が認識されています。

がんゲノム医療×AI

がんゲノム医療の分野では、人工知能(AI)は特にゲノムデータ解析、知識データベースにおける自然言語処理、そしてレポート作成におけるアノテーションにおいて期待されています。

 

ゲノムデータ解析においては、次世代シークエンサーよって得られたゲノムの生データを解析し、変異遺伝子をマッピングし、この中で医学上重要と思われる変異を過去のデータに基づいて検出します。更に、この一連の作業となるパイプラインがGPUやFPGAにより高速化されます。

 

次に知識データベースにおいては、AIにより世界中の複数のデータベースを統合し、一括して検索することが可能なシステムを構築します。

 

レポート作成においては、AIにより報告書や患者向けの説明補助資料の作成を支援します。知識データベースを参照し、臨床的意義付けを支援する判断補助資料を作成し、アノテーションサービスとしてエキスパートパネルに提供することもできます。当事者や親族にもわかりやすいイラスト入り説明補助資料を作成することもできます。

医療AIへの取り組みと医療AI製品化のポイント

人工知能(AI)においては、本来は医療とは異なる目的で研究開発されるのが通常です。そして異なる目的で研究開発されたAIが医療においても有効に利用される場合があります。例えば、通行人の顔認識技術は医療における腫瘍の画像診断に応用されています。AIにとって顔検出と顔照合は腫瘍の検出と照合と同様の作業になります。

 

但し医療においては、判断根拠の明示が重要であり、可能であれば複雑でBlack Box型の深層学習よりも単純な決定木や回帰分析の方が好まれる傾向があります。決定木と回帰分析を組合せて場合分けして異なる回帰式を使用する方法も研究されています。

 

AI医療機器の商品化においては、リスクごとに定められた規制に基づいて安全性と有効性に関する臨床試験を行い、必要書類として医療AI製品の開発に使用されたデータ、AIアルゴリズムやハイパーパラメータ等に関する情報を開示する必要があります。

情報科学の立場から

遺伝病の研究では機械学習がよく利用されます。教師あり学習では決定木とランダムフォレストが特に便利で、特徴量の重要度を明示し、予測精度も高いです。又、多くの場合にdefaultでデータを解析できます。教師なし学習では主成分分析が代表的で、多次元データの図示に役立ちます。機械学習にはR言語が特に適していて、簡潔なプロブラムとデータの可視化が特徴的です。但し、複雑な深層学習にはPythonの方が人気です。

 

タンパク質構造のデータから疾患を予測する場合には、まず変異体構造モデリングを行い、wild type-mutant間の構造変化の観点から変異体と疾患の関係を物理的に計算します。ここで得られたデータを基に決定木やランダムフォレスト等を使用します。Rではライブラリを参照し、わずか数行のプログラムで実行することが可能です。更に最近では、深層学習を使用してタンパク質の構造を予測することも行われています。利用しやすいソフトウェアも開発されています。