機械学習は大きく教師あり学習、教師なし学習、強化学習に分類されます。教師あり学習は主に回帰や分類に、教師なし学習は主にグループ分けや情報の要約にそれぞれ利用されます。強化学習は将棋、囲碁等のゲームやロボットの歩行学習等に利用され、統計学とは無関係に行われます。教師あり学習には正解を含むデータが使用されます。強化学習では試行に対する報酬又は評価が与えられます。教師あり学習と教師なし学習の組み合わせである半教師あり学習もあります。
教師あり学習の代表的な分析手法は回帰分析、最近傍法、決定木、サポートベクターマシンで、教師なし学習の代表的な分析手法はk平均法、アソシエーション分析や次元削減です。現在は深層ラーニングがよく使用されます。これは多層パーセプトロンとバックプロパゲーションを用い、データの特徴を自己学習できるものです。活性化関数が改良されることにより、バックプロパゲーションの際の勾配消失を防止できるになりました。
教師あり学習の代表例である回帰分析では散布図の作成、モデルの推定と有効性の検討、各独立変数の影響度の検討を行います。有効性の検討では決定係数と重相関係数の計算、統計的検定、残差分析を行います。多重共線性とは独立変数同士に強い相関があることです。回帰分析では変数の解釈を重視し、モデルがシンプルになります。これに対して、ディープラーニングでは精度を重視するのでネットワークが複雑化し、人間が解釈し難いブラックボックスとなります。
教師なし学習の次元圧縮では、説明変数を主成分分析により最も寄与率の高い成分とその他の成分にまとめます。2つの成分にまとめる場合には固有方程式を解き、固有値の多きい方が第1成分となり小さい方が第2成分となります。
クラスタリングも教師なし学習で、正解のない大量のデータを類似したデータに分割する手法です。階層的クラスタリングと非階層的クラスタリングがあります。前者の代表例が樹形図で後者の代表例がK-means法です。
現在核医学の分野においても人工知能(AI)を利用する研究が行われ、一流の学会雑誌にも発表されています。例えば、AIによる病変や臓器の自動検出、輪郭決定及び質的診断が行われています。又、医療現場においては多くの正常な画像は注目されずに処分されますが、正常画像から年齢を予測することによる臓器別の老化対策についても研究されています。更に低線量低被爆で撮影されたノイズを含む医療画像から高画質画像を作出し、画像検査における被験者の放射線被爆を減少させる方法も研究されています。この方法の優れた特徴として、既に存在する高画質画像からノイズを加えた低画質画像を作成することにより専門医によるラベル付けを必要とせずに教師データを得ることができます。このようなAIの有用性はある程度証明されていますが、AIによる判断過程がブラックボックスのままではAIが医療の現場で使用されることが困難です。これから説明可能なAIの開発が望まれています。
核医学の分野においては、人工知能(AI)は主に画像診断支援、画像生成、ノイズ除去に威力を発揮します。AIによる高精度な画像診断を使用したダブルチェックは医師の負担を軽減し、病気の早期発見に役立つことが期待されています。現在でも画像診断のソフトウェアが開発されています。ここではデータの前処理が重要で、標準化、平滑化(ノイズ除去)、画像間差補正、マスク処理、カウント規格化という複雑な過程を要します。その後統計解析等を行います。
画像生成では、ある画像から別の種類の画像を推定します。例えば、ある患者のPET画像からCT画像を予測し、作成します。結果的に患者が受ける検査数を減少させることができます。又、低線量被爆で撮影された低画質画像からノイズを除去することにより高画質画像を作成する研究も行われています。この技術により、患者が検査による放射線被爆を減少させることができます。
人工知能(AI)を骨シンチグラフィに応用し、BSI(Bone Scan Index)値を自動計算する方法が開発されています。BSI値は癌転移の状態を数値化したものであり、患者の予後に大きく影響します。様々な癌転移と治療法の組み合わせについて異なるBSI値が計算されるので癌転移に対する治療法の効果を予測することもできます。
但し、BSI値の計算は検査機器、放射性医薬品の投与量、患者に関する当該疾患以外の条件(尿バック等)や画像のノイズ等によって影響を受けるので注意が必要です。又、同一患者を経過観察する場合には、同一のソフトウェアで解析することが強く奨励されます。
解析フローとしてはまず、骨シンチグラフィを行い、画像の中の骨格を分類(Morphon理論)し、高集積部分を検出し、データを正規化します。そして高集積部分を定量し、AIがこの定量化されたデータを分類し、BSI値を計算します。この際、CT等の他の画像や血液データ等を加えた分析も研究されています。
医用画像においても人工知能(AI)、特にConvolutional Neural Networkを用いて画像分類、物体検出、セグメンテーション、超解像、ノイズ除去や類似画像の生成を行うことができます。セグメンテーションでは物体検出と異なり、不規則な形状の対象物を検出します。セグメンテーションの中でも、Semantic、Instance、Panoptic Segmentationと進化し、全てのピクセルにラベルを付け、物体を個別に認識できるようになりました。それぞれの評価方法も異なります。
但し、セグメンテーションにおける教師データの作成は手間が掛かります。物体検出では対象物をbounding boxで大まかに囲うのに対し、セグメンテーションでは対象物を正確に定義しないとAIが間違って学習してしまいます。又医用画像は、DICOMという特殊な画像形式で保存され、サイズも一定していません。そこで画像形式とサイズをAI学習用に変換します。通常は、更にデータ数を拡張する必要もあります。その後学習パラメータを固定し、AIモデルの訓練、評価を行います。
人工知能(AI)による画像分類の研究を行う際にはまず、分類の対象、分類の目的そして使用する画像データを過去の文献に基づいて決定する必要があります。AIの精度が高いほど難易度が高くなり、研究の意義も大きくなります。原則的には自分が所属している研究機関や病院が得意とする分野を選択します。
次に使用する画像データの種類、断面方向、範囲、サイズ等を決定し、必要データ数に応じてデータ拡張を行います。その後画像データを訓練データとテストデータに分割します。
AIモデルとしては多くの場合、Convolutional Neural Networkを転移学習又はファインチューニングとして使用し、optimiser(多くの場合はAdam)とハイパーパラメータ(ミニバッチ数、エポック数、学習率)を経験的に指定し、モデルの訓練を行います。最後にテストデータを使用して訓練したモデルの性能を検証します。
AIを使用する研究は経験則に基づくことが多く、試行錯誤を繰り返し、AIの応用範囲や限界がわかるようになります。
人工知能(AI)による動画処理の役割としては、歩き方や動作フォーム等に関する動画記録の事後解析、監視、異常検出、センサーとしてのリアルタイム動画の解析、そして動画要約等の動画の意味理解があります。そして動画とは、一つ一つの静止画像の連続であり、一秒間の画像数をfps(frame par second)で表示します。それぞれの動画について画像分類、物体検出やセグメンテーションを行い、これらを連続させることによりAIが動画を分析しているように見えます。
医療においても動画が使用され、AIの活用が期待されています。例えば、正確なレントゲン撮影機器と被写体との位置関係をAIによって予測することができます。つまりAIがレントゲン撮影の補助を行うことになるのです。但し、動画の学習には画像単位で教師画像を作成する必要があります。更にAIが必要な学習を行えるようにするためには、得られたデータをどのように処理するかを計画する必要があります。
自然言語処理(NLP)とは自然言語に係る問題をコンピュータで解くことです。NLPは機械翻訳や文書要約に応用される形態素解析、文書分類や感情分析に応用される構文解析、チャットボットや固有表現描出に応用される意味解析、文書生成や関係抽出に応用される文脈解析から成ります。形態素解析では単語分割、原形への復元、品詞付与を行います。稀な単語はサブワードとしてトークン化されます。この際に医療用語は独特なので注意が必要です。
現在では文字情報は数値化され、これを分散表現と言います。Word2vec、fastText、Doc2vec等によってこのような文字のベクトル化が行われます。最近では、NLPの分野においても深層学習が使用されます。初期では再帰型ニューラルネットワーク(RNN)が使用されていましたが、勾配消失という問題がありました。現在ではLSTM、Seq2seq with Attention、Transformerや非常に汎用性の高いBert(Bidirectional Encoder Representations from Transformers)が開発され、高度なNLPが可能になりました。Bertではラベル無しデータによる事前学習と少量のラベル付きデータによるファインチューニングが行われます。
現在人工知能(AI)の深層学習技術は創薬にも活用されています。バイオインフォマティクスではタンパク質の構造や相互作用を予測します。ケモインフォマティクスでは候補化合物の自動設計や薬物動態、毒性の予測を行います。既存薬を利用した新薬開発ではネットワークベース、遺伝子発現ベース、ドッキングシュミレーションベース等により、既存薬の新たな使用方法を発見します。他方で、AIによるタンパク質立体構造を予測し、この構造に結合しやすい立体構造を持つ新薬候補を提案します。更にAIによる副作用予測や人間には想定できない分類も可能です。
但しAI創薬では、安全性の確保や誤った予測に対する責任、個人情報保護、データ収集にかかる期間、教師データの正確性、企業の知的財産権等の多くの解決すべき課題もあります。そもそも医療データはあくまで治療を目的として収集されたものであり、この医療データをどのようにAIの学習に使用するべきかという問題があります。
ヘルスケア分野での人工知能(AI)の適用には、各AI開発段階で解決する必要のある様々な課題が含まれます。データの調査と分析の段階では、医療データセットにおける注釈とラベル付けの不備、クラスの不均衡や、バイアスがよく見られます。適切なデータ収集と準備が不可欠です。 AIモデルを構築するには、過剰適合を回避し、堅牢性と一般化可能性を確保する必要があります。ハイパーパラメータの選択は、これらの問題に対処するための鍵です。パフォーマンスチェックでは、AIモデルによるパフォーマンスの信頼性を定期的に評価する必要があります。
現在、AIは放射線医学、特に画像診断のために広く開発されています。画像診断のためのAIの使用は大まかに、検出、セグメンテーション、分類の3つの目的に分類できます。検出は、医用画像で関心のある標的病変を特定するために行われます。セグメンテーションは、関心のある標的病変の境界を記述するために実行されます。分類は、標的病変を分類するために実行されます。目的ごとに異なるAIモデルが選択され、機械学習用の様々なPythonパッケージをヘルスケア分野のAI開発にも使用することができます。
現在人工知能(AI)は様々な分野で利用され、特に画像認識においては人間よりも高度な能力を発揮しています。質の悪い画像にはノイズが伴い、人間には内容を判別することが困難な場合が多々あります。AIはこのノイズを除去することにより鮮明な画像を再現することができます。又AIは、暗い場所で撮影され肉眼では対象物がよく見えない画像や障害物により対象物が隠れている画像においても対象物を再現する能力があります。
そしてこのようなAIによる画像認識は医療、交通、ビジネス、環境等の様々な産業分野に応用されています。例えば、土木分野における地下鉄通路においては安全性の見地からトンネルに損傷がないかを常に確認する必要があります。地下鉄通路の距離は極めて長く、人間が全ての個所を直接確認することは非常に困難です。この場合にAIが損傷部分を認識し色分けして画像化することにより、修復が必要な場所を効率よく発見することができるようになるのです。
現在人工知能(AI)は急速に発展し様々な分野で利用され始めました。しかしながらこれからAIが広く実用化されるためには主に3つの課題を達成する必要があります。1つ目はAIの精度がその分野の専門家に匹敵することです。2つ目はAIが判断する過程が説明可能になることです。そして3つ目は少ないデータでAIモデルを訓練することが可能になることです。特に医療においてはプライバシー保護の観点から患者データを収集することが非常に困難です。
近年Generative Adversarial Networks(GAN)が発明され、一つの画像データから類似した画像を大量に作成することが可能になりました。つまり少量の画像データから類似した大量の画像データを作成し、高精度なAIモデルを作成することも可能になりました。更に人間の認識過程を感知する技術も開発され、AIがこの過程を真似し、視覚化することができるような研究が行われています。これによりAIが判断する過程が理解可能になります。
医療機器とは、疾患の診断、治療、予防に使用されるもの、または、人体の機能に影響を及ぼすことを目的としているもの(薬機法)です。医療機器プログラムとは、医療機器としての目的を持ち、意図した通りに機能しない場合、患者や使用者の生命、健康に影響を与えるおそれがあるプログラム(SaMD:Software as a Medical Device)で医療AIはこれに含まれます。
理論上は疾患の種類とヘルスケアサービスの種類(問診、検査、診断、治療、創薬、インフォーマルケア)に応じて医療AI製品を開発することが可能です。但し、実際の医療の現場のニーズや法的規制に合致したAI製品のみが市場で受け入れられることが実情です。
AI製品を医療機器として販売する場合には製造販売認可の取得や品質、安全性の確保のために多大な開発コストや一定の期間を要します。その分、臨床における使用が可能になり、参入障壁も築きやすいことがメリットとなります。
最近では人工知能(AI)における医療画像関連の応用例が数多く研究開発されています。理由としては主に3つ挙げられます。1つ目は画像認識における人類の能力を超えたConvolutional Neural Network等の技術革新、2つ目はコンピュータと処理能力とStorageの向上、3つ目は臨床画像の統一されたデジタル化です。そして医療画像への応用としては主に3つのカテゴリーに分類されます。1つ目はAssisted Interpretation、2つ目はAdditional Insights、3つ目はAugmented Imageです。
Assisted Interpretationでは自動異常検出等の画像診断サポートを行います。Additional Insightsでは画像所見と臨床結果の新たな関連性を発見します。Augmented Imageではノイズ除去等の画像クオリティの向上を行います。但しそれぞれ解決すべき課題もあります。Assisted Interpretationでは画像診断の専門医による教師データの作成や適切な転移学習が必要です。Additional InsightsではAIで解析された数値データが組織の特徴を正しく反映する必要があります。Augmented ImageではAIモデルの訓練のみならずテストデータが十分な画像情報を保持している必要があります。