AIが数千万の「ミスセンス変異」を予測することに成功、人類遺伝学の課題解決に期待

AIが数千万の「ミスセンス変異」を予測することに成功、人類遺伝学の課題解決に期待

人工知能(AI)は、人類の遺伝学における最大の課題の1つを解決すると期待されています。

ちょうど今、 Google DeepMindの研究チームがAlphaFold方法論に基づいてAlphaMissenseを作成しました。これは、タンパク質配列データベースと変異構造の背景を利用して、病原性のミスセンス変異と未知の病原性遺伝子を特定することができます。

AlphaMissense は、多くの既存の類似ツール (変異効果予測子または VEP) と比較して優れた機能を発揮することが報告されています。

具体的には、AlphaMissense は 19,233 個の標準的なヒトタンパク質における 2 億 1,600 万個の可能性のある単一アミノ酸の変化の病原性を予測することに成功し、7,100 万個のミスセンス変異を予測しました。その後、 AlphaMissense はミスセンス変異の 89% を正確に予測し、そのうち 57% は良性であり、32% は病原性である可能性があることが判明しました

「AlphaMissense によるプロテオーム全体のミスセンス変異の影響の正確な予測」と題された関連研究論文が、権威ある科学雑誌 Science に掲載されました。

同時掲載の意見記事で、エディンバラ大学の計算タンパク質生物学教授ジョセフ・A・マーシュ氏と、ウェルカム・サンガー研究所の細胞遺伝学部門長でケンブリッジ大学の研究員サラ・A・タイヒマン氏は次のようにコメントしている。

「この研究は間違いなく変異の解釈と優先順位付けに役立つが、複数の証拠に基づくこれらの用語の特定の臨床定義とこれらのラベルを混同しないことが重要だ」

Google DeepMind が AlphaMissense のすべての予測を研究コミュニティに無料で公開し、AlphaMissense モデルのコードをオープンソース化していることは注目に値します。

ミスセンス変異の89%を予測することに成功

ミスセンス変異とは、タンパク質のアミノ酸配列を変化させる可能性のある遺伝的変異です。病原性のミスセンス変異はタンパク質の機能を著しく損なわせ、生物の適応度を低下させる可能性がありますが、良性のミスセンス変異は影響が限定的です。

観察された 400 万を超えるミスセンス変異のうち、臨床的に病原性または良性として分類されているのは約 2% のみであり、残りの未知の変異を分類することは、人類遺伝学における大きな課題です。ミスセンス変異の正確な機能予測が欠如しているため、希少疾患の診断率や、根本的な遺伝的原因を標的とした臨床治療の開発と応用が制限されています。

変異体効果の多重解析 (MAVE) はタンパク質変異体の影響を体系的に測定し、変異体の臨床結果を正確に予測することができますが、MAVE 実験はコストがかかり、労働集約的であるため、変異体の病原性に関するプロテオーム全体の調査は不完全なままです。

機械学習手法は、生物学的データ内のパターンを活用して注釈のない変異の病原性を予測することにより、この変異の解釈のギャップを埋めることができます。 AlphaFold の成功により、タンパク質配列を入力として使用して大規模で高精度なタンパク質構造を予測できることが実証され、このようなタンパク質構造モデルは、変異体の病原性など、タンパク質生物学の他の側面を理解するための基礎として役立ちます。

この研究では、 AlphaMissense は AlphaFold の方法論を活用して、既存の戦略の 3 つの要素を組み合わせました

1) 人口頻度データに基づく弱くラベル付けされたトレーニングにより、手動の注釈の使用が回避され、循環性が回避されます。

2) 教師なしタンパク質言語モデリングタスクを使用して、配列コンテキストに条件付けられたアミノ酸分布を学習する。

3) AlphaFold から派生したシステムを使用してコンテキストを統合します。

論文によれば、 AlphaMissense のトレーニングは、構造事前トレーニングとバリエーション微調整の 2 つの段階に分かれています。事前トレーニング フェーズは AlphaFold で説明されているものと同じですが、マスクされた複数のシーケンス アライメント再構築損失に、より高い重みが追加されます。微調整中に、モデルは変異体の病原性と参照配列の構造を同時に予測するように最適化されます。

これまでの研究では、良性のトレーニングバリアントは、PrimateAI メソッドに従って定義される、人間や他の霊長類種で頻繁に観察されるバリアントに基づいているのに対し、病原性のトレーニングバリアントは、トリヌクレオチドのコンテキストと遺伝子に応じてサンプリングの重み付けが行われ、人間の集団で観察されたことのないバリアントからサンプリングされていることが示されています。

AlphaMissense は、突然変異がタンパク質構造に与える影響や、タンパク質の安定性に及ぼすその他の影響を予測するものではありません。代わりに、関連するタンパク質配列のデータベースと変異体の構造的コンテキストを使用して、変異体が病原性である可能性が高いかどうかを評価する 0 から 1 の間のスコアを生成します。連続スコアにより、ユーザーは、変異体を病原性か良性かに分類するための精度要件を満たすしきい値を選択できます。

AlphaMissense は、7,100 万の可能性のあるミスセンス変異のうち 89% を、病原性の可能性が高い、または良性の可能性が高いと分類しました。対照的に、変異体のわずか0.1%が人間の専門家によって確認されています。

AlphaMissense は、そのようなデータで明示的にトレーニングすることなく、幅広い遺伝的および実験的ベンチマークで最先端の予測を実現します。

このモデルは、人間の変異と疾患の関係に関する公開データアーカイブであるClinVarの変異の分類に使用された際にも、他の計算方法よりも優れた性能を示した。

人類の遺伝学の謎を解く潜在的解決策

AlphaMissense の予測は、間違いなく、変異がタンパク質機能に及ぼす分子的影響を明らかにし、病原性のミスセンス変異や未知の病原性遺伝子を特定し、希少遺伝性疾患の診断率を向上させるのに役立ちます。さらに、AlphaMissense は、特殊なタンパク質変異体効果予測子のさらなる開発を促進します。

マーシュ氏とタイヒマン氏は、AlphaMissense の限界についても指摘した

現在、その予測子の構造要素は、ほとんどのタンパク質が多様な四量体構造を持つ複合体または凝縮体に組み立てられることを考慮していません。複合体を形成するタンパク質の変異は、単量体構造のみを考慮すると明らかではない方法で疾患を引き起こす可能性があります。

さらに、多くの疾患関連変異はタンパク質の不安定性や複合体の組み立ての破壊を通じて機能喪失を引き起こしますが、他の場合には、変異タンパク質が優性負性効果や相乗効果を通じて疾患を引き起こします。

したがって、通常はアミノ酸に対する小さな変動であり、これまでにテストされたほぼすべての変異効果予測子 (VEP) では正確に予測することが困難な、機能喪失型ではない変異体に対して AlphaMissense がどのように機能するかを観察することは興味深いことです。

最終的には、タンパク質複合体の構造を予測するアルゴリズムを通じて、タンパク質四量体構造に関する情報を組み込むことが可能になり、変異効果予測の分野でのさらなる改善につながることが期待されます。

参考リンク:

www.science.org/doi/10.1126/science.adg7492

www.science.org/doi/10.1126/science.adj8672

著者: ヤン・イーミ

編集者: 学術

<<:  秋分の日にこれらの症状が出たのに気づかない人は、シェーグレン症候群の可能性があるのでご注意ください!

>>:  水中に「四つ足の生き物」はいますか?奇妙な見た目の張氏のユニコーンシュリンプ

推薦する

毎日ヨーグルトを一杯飲むと体にどんな変化が起こるのでしょうか?答えを推測することは決してできないでしょう。

ヨーグルトは多くの人が好んで飲む飲み物です。とろみのある食感が好きな人もいれば、酸味が好きな人も、栄...

中国ブランドのベストセラーエグゼクティブセダンとして、BYD HanはAudi A6Lに挑戦する力を持っているのでしょうか?

BYD HanとAudi A6Lを比較すると、多くの人は全く比較の余地がないと感じるでしょう。 1...

コーンミールの効能と機能

コーンミールの効果と機能は何ですか?まず、コーンミールとは何かを理解しましょう。コーンミールは、ホワ...

とても悲しい!中国で初めてジャイアントパンダを研究した人が亡くなりました...

2月16日の夕方「中国初のパンダ研究者」として知られる胡錦初教授が死去彼は中国では有名な動物学者で...

1月から5月にかけて、自動車産業全体の運営は安定しており、新エネルギー車は急速な成長を維持した。

中国自動車工業協会は6月11日、北京で記者会見を開き、自動車業界の経済運営について報告した。統計によ...

がんはあなたから「救われる」のです!医師が真実を明かす!この悪い習慣は変えなければならない

この記事の専門家:胡侯祥、四川北医学院付属病院心臓科主任医師、教授、医学博士、マスター指導者鄭在勇、...

有名女性スターが「不治の病」を患っていることを告白!医師らは、この病気は誤診されやすく、再発する可能性があると警告している。

ここ数日、長い間姿を見せていなかった歌手ペニー・ダイが、突然再び注目を集めている。当時、テレビドラマ...

人類は最終的に恒星間文明を築くことができるのでしょうか?マスク氏は、複数の惑星に住む種族を創造するには長い時間がかかるだろうと述べた。

答えは「はい」ですが、前提条件として、人類の技術文明が少なくとも 200 年間は継続することが求めら...

スパイシーペッパーポークの作り方

唐辛子は私たちが生活する上で最も多く食べられている唐辛子です。唐辛子はビタミンCを比較的多く含む野菜...

朝にこの習慣があると、アルツハイマー病のリスクが 4 倍に増加します。急いでこの「脳を鍛える」戦略を実行してください!

アルツハイマー病は遠い病気のように思えますが、ますます一般的になりつつあります。中国老年医学協会が発...

便秘でも毛ガニを食べても大丈夫ですか?

毛ガニの原料についてですが、城陽湖産の毛ガニの方が美味しいことは皆さんご存知だと思います。日常生活で...

360 が Coolpad マスターを導入: 彼はどの程度の役割を果たせるでしょうか?

Qihoo 360はCoolpadとの戦略的提携を結ぶために4億ドルを投資した。これは間違いなく今...

醤油の役割

薄口醤油は主に日常生活の調味料として使われています。特に私たちのお気に入りの炒め物を作るときに使うと...

智集汽車はCATLと共同で新エネルギー車の航続距離を1,000km以上に延長できる新しいバッテリー技術を開発している。

最近、智集汽車は、同社の技術チームがCATLと協力して「シリコンドープリチウム補充電池セル」技術を開...