98% を超える精度を誇る AI が、がんの早期スクリーニングへの新たなアプローチを実現します。がんの早期治療の時代が来るのか?

98% を超える精度を誇る AI が、がんの早期スクリーニングへの新たなアプローチを実現します。がんの早期治療の時代が来るのか?

がんは人類が直面する最も困難な病気の一つであり、毎年1,900万人以上の新規患者と1,000万人以上の死亡者が出ています。がんの早期発見と既存の治療法を組み合わせることで、あらゆる種類のがんの生存率と治療結果を大幅に改善することができます。

現在、人工知能(AI)はこのプロセスをスピードアップさせると期待されており、医師は近い将来、AIを使用して患者のがんを検出し診断し、より早期に治療できるようになるかもしれません

最近、インペリアル・カレッジ・ロンドンとケンブリッジ大学の研究チームが人工知能モデル「EMethylNET」を訓練し、DNAのメチル化パターンを観察することで、非がん組織から13種類のがん(乳がん、肝臓がん、肺がん、前立腺がんなど)を最大98.2%の精度で識別することに成功した。

「がん特有の DNA メチル化パターンを明らかにする解釈可能な機械学習によるがんの早期検出と診断」と題された関連論文が Biology Methods and Protocols に掲載されました。

論文によれば、このモデルは血液中のDNA断片ではなく組織サンプルに依存しており、まだ実験段階にある。臨床現場でさらに使用できるようになるには、さらにトレーニングと、より多様な生検サンプルのテストが必要です。

研究者たちは、この研究の重要な意義は、説明可能な人工知能モデルを使用して、その予測の背後にある論理を説明している点にあると考えている。この研究ではモデルの内部の仕組みも調査され、発がんの根底にあるプロセスの理解が大幅に向上することが判明した。

マルチ分類モデルは、98% を超える精度で良好なパフォーマンスを発揮しました。

がんは常に人類が直面している最も困難な病気の一つです。がんの進行は非常に複雑であり、発見された時期とともに治療の難しさが増します。がんの早期スクリーニングは非常に重要であり、医療界が懸命に取り組んでいる重要な方向性の 1 つです。

遺伝情報は DNA 内の 4 つの塩基 (A、T、G、C) のパターンでエンコードされます。細胞外の環境の変化により、特定の DNA 塩基にメチル基が追加されて修飾されることがあります。このプロセスは「DNA メチル化」と呼ばれます。各細胞には数百万の DNA メチル化マークがあります。研究者らは、がんの発症の初期段階でこれらのマーカーの変化を観察し、それががんの早期診断に役立つ可能性があると考えている。さまざまながんの種類に特有の DNA メチル化シグネチャを特定することは、干し草の山から針を見つけるようなものです。

本研究では、研究チームは機械学習の手法を用いて、13種類のがんとそれに対応する正常組織のDNAメチル化マイクロアレイデータを活用し、正常組織特有のメチル化からがん特有の変化を特定しました。メチロームデータは Illumina Infinium アレイに基づいており、方法は「方法」で説明されているように抽出、クリーニング、処理されました。メチル化マイクロアレイ データは、メチル化プローブと非メチル化プローブのペアを使用して分析され、特定の CpG 位置でのメチル化プローブの強度と全体の強度の比率 (ベータ値と呼ばれる) が決定されました。

彼らは、ロジスティック回帰、サポートベクターマシン (SVM)、勾配ブースティング決定木 (XGBoost)、ディープニューラルネットワーク (DNN) の 4 つの異なるモデルタイプをトレーニングし、評価しました。最初の 3 つのモデル タイプでは、バイナリ分類モデルとマルチ分類モデルが作成されました。

バイナリ ロジスティック回帰モデルはバイナリ XGBoost モデルよりも大幅に優れたパフォーマンスを発揮せず、マルチクラス ロジスティック回帰の MCC スコアはマルチクラス XGBoost および DNN よりも低いため、この研究では XGBoost と DNN に焦点を当てて分析を行います。

これらの独立したデータセットでテストしたところ、ほとんどのバイナリ XGBoost モデル (TCGA データでトレーニング済み) は良好なパフォーマンスを示しました。より堅牢なモデルを作成し、これらの結果を改善するために、研究者は、マルチクラス XGBoost から学習した特徴に基づいてトレーニングされた DNN モデルで構成されるモデルである EMethylNET を設計し、パフォーマンスをさらに向上させました。

図 |方法の概要

個々の腫瘍と正常組織の DNA メチル化のバイナリ分類を実行して癌の状態を検出することにより、13 のモデルのうち 5 つ (COAD、KIRC、LUAD、LUSC、UCEC) が完璧なテスト セット パフォーマンスを達成しました。すべてのモデルの平均精度は 98.7%、平均 MCC (深刻なクラス不均衡の影響を受けないパフォーマンス メトリック) は 91.9% でした。

彼らはトレーニング データ全体に対してマルチクラス XGBoost モデルをトレーニングし、 13種類の癌を正常サンプルと非常に正確に区別することができました。全体の精度は98.2% 、全体のMCCは 98.0% でした。同時に、このモデルは独立した異種データセットで高い精度を達成し、独立したデータセットでも優れたパフォーマンスを示します。

図 |独立したデータセットにおけるバイナリ XGBoost モデルのパフォーマンス

がんの検出と分類におけるメチル化に基づくアプローチの使用に関する文献は膨大であり、増え続けています。 EMethylNET と他の関連研究との比較分析が行われ、EMethylNET が類似の研究の中で競争力のあるテスト セット パフォーマンスを達成することが実証されました。

表 |関連研究の概要

複数の種類の遺伝子ががん関連プロセスと密接に関連している

XGBoostなどの解釈可能な方法を使用する主な利点は、分類のための特徴を識別できることであり、研究チームはマルチクラス XGBoost モデル (つまり、EMethylNET の入力特徴) から PCC を調査しました。 PCC は近位遺伝子にマッピングできます。近位遺伝子とは、遺伝子本体またはプロモーター領域 (転写開始部位の上流 1500 塩基対ウィンドウ) が PCC と重複する遺伝子のことで、複数のクラスの PCC を近位遺伝子にマッピングすることで得られる遺伝子は「マルチクラス遺伝子」と呼ばれます。

研究者らは、複数のカテゴリーの遺伝子について機能エンリッチメント解析を実施し、発癌や転写調節機能に寄与する遺伝子が豊富に存在し、がん関連の経路やネットワークも豊富に存在することを発見した。マルチクラス遺伝子セットは、229 個の既知の腫瘍抑制因子と癌遺伝子、546 個の転写調節因子で構成され、広範囲の癌関連の経路とプロセスに関与しています。

さらに、遺伝子リストには主に lncRNA で構成される非コード RNA 遺伝子が多数含まれていることも判明しました。これは、lncRNA やその他の非コード RNA が発癌において重要な役割を果たしていることを示す研究が増えているという見解と一致しています。

関連研究と比較すると、この研究は、シグネチャ分析結果に潜在的なバイアスを加える可能性のある事前の特徴選択なしに、モデルによって CpG が自由に選択される詳細なシグネチャ分析を提供する最初の研究です。

AIによるがん予測はもうすぐ実現?

「より多様なデータによるより良いトレーニングと、クリニックでの厳格なテストを通じて、このような計算手法は最終的に、がんの早期発見とスクリーニングを医師が行うのに役立つAIモデルを提供するだろう」と、論文の責任著者であるシャミス・A・サマラジワ氏は述べた。 「これにより、より良い治療結果が得られるでしょう。」

このアプローチは、トレーニング データの可用性に応じて、数百種類のがんを検出するように拡張できます。将来の応用には、このアプローチを細胞外 DNA からの DNA メチル化データに拡張することが含まれており、最終目標は液体生検アプローチによる複数の種類の癌の早期発見です。

さらに、このアプローチの明確な臨床応用は、特定の癌の種類または原因不明の癌のスクリーニングであり、現在のモデルはこの目的に最適化されていないものの、この分野では拡張の余地があります。

参考リンク:
https://academic.oup.com/biomethods/article/9/1/bpae028/7696058

<<:  劉江原人の年代測定により、東アジアの現代人の起源に一歩近づきました。

>>:  「公園で20分」よりもリラックスできるものを、費用ゼロで!やったらすぐに幸せになれる

推薦する

夏に心臓の健康のために食べるべき10の食品

夏は薄着や布団を着ることが多くなります。健康な人でも外部からの感染には注意が必要です。一度病気になっ...

中国人が海に出て世界を見る道+1、中国初の国産大型クルーズ船「アイーダ・マジックシティ」!

レビュー専門家:北京科学ライター協会会員、朱光思我が国の発展過程を振り返ると、大規模な農業国から工業...

【賢い農家】虫を食べて食べ物を破壊!悪名高いイネ害虫、トビイロウンカの駆除

節足動物は動物界で最も繁栄しているグループの一つで、昆虫の種は推定550万種あり、そのうち約100万...

酢漬け生姜の効能と機能

魚料理などの美味しい料理を作るときは、必ず生姜が必要です。生姜は私たちの生活の中で一般的な調味料と言...

反物質は本当に存在するのでしょうか?どれくらい高価ですか?それは人類を滅ぼすために悪者によって利用されるのでしょうか?

私はこれまで何度も反物質の問題について話をしてきましたが、それについて疑問を抱いている友人はまだたく...

科学者が新たな発見をしました!多肉植物の不思議な液体輸送現象を解明

制作:中国科学普及協会著者: Shi Chang (物理化学博士)プロデューサー: 中国科学博覧会編...

冬のおいしいキノコ料理

キノコの栄養価は昔から認められており、冬の健康維持には最適な食材です。タンパク質やビタミンが豊富なだ...

自宅で料理の仕方を学びたいなら、まずはレシピの読み方を学んでください!

混合知識混乱を治すために特別に設計されています!...

酢と重曹がなぜ汚れを落とすのでしょうか?

いつから始まったのかは分かりませんが、キッチンの棚にある調味料が少しずつ掃除用品に変わり始め、最初に...

プシュケを探索する旅が始まります!目標は「黄金の惑星」だけではない

10月13日北京時間22時19分、米国のファルコン・ヘビーロケットが探査機を載せてケネディ宇宙センタ...

バラの香りのブドウを食べるのに最適な時期はいつですか?

田舎に住んでいる友人なら、暑い夏によくこのような状況を目にするでしょう。ブドウの木を栽培している人の...

繁栄した唐の時代のこの「首都」の人口は 100 万人を超えていました。千年後、地球上に再び現れるのでしょうか?

1961年12月11日、千年以上前に100万人の人口を擁した大都市の遺跡が我が国で発掘されました。...

地球の自転を肉眼で観察してみましょう!このシーンは本当に衝撃的だ

「地球の自転を肉眼で見ました!」最近、写真家のガオ・ボーは赤道儀を使用して地球の自転のタイムラプス撮...

うつ病の食事療法にはどのようなものがありますか?

悪い食習慣はうつ病の原因の 1 つです。私たちの神経系は、私たちが食べる食べ物と密接に関係しています...