生命科学の分野には、顕微鏡レベルの細胞生物学や分子生物学、生物と環境の関係を研究する生態学など、さまざまな研究分野があります。生命活動の法則や発生のメカニズム、生命の本質に最も近い研究は、タンパク質や核酸の構造などの生体高分子に関する研究です。 タンパク質に関する体系的かつ徹底的な研究は、生物の構成と動作の変化をより深いレベルで解釈し、生命の動作と発達のメカニズムをさらに完全に解明し、生物科学、医薬品開発、合成生物学の発展を促進することを可能にします。そのため、タンパク質の研究、タンパク質の構造予測などは、学界と産業界が深く関わっている分野です。 AI時代では、計算能力とアルゴリズムモデルの驚異的な向上により、タンパク質構造予測の歴史的な瞬間も目撃しました。 2年ごとに開催されるCASPコンテストは、「タンパク質構造予測の分野におけるオリンピックコンテスト」として知られています。 CASP14(2020年第14回国際タンパク質構造予測コンペティション)に基づくタンパク質テストセット評価において、天朗TRFoldは、中国で公開されているすべてのタンパク質構造予測モデルの中で、世界第1位のDeepMindのAlphaFold2に次ぐ最高の結果を達成しました。 CASP コンテストは非常に名誉あるコンテストです。このような国際的な競争で優秀な成績を収めることは、国内の計算生物学が突破口を開き、世界のトップ層に躍り出たことも意味します。 世界的に有名な AlphaFold2 モデルであれ、国内の新製品 TRFold モデルであれ、これらの最先端の AI モデルは、生命科学の触媒効率の分野での研究に貢献してきました。タンパク質研究の価値探索プロセスを辿り、生命科学と医学の分野を再構築する旅を見てみましょう。 科学研究のアイデアと研究スペースを開拓する 中学校ではタンパク質について簡単に学びました。タンパク質は細胞内の主要な機能分子であり、ほぼすべての細胞機能に関与していることがわかっています。たとえば、食物の消化を触媒できるさまざまな酵素などです。血液中のヘモグロビンは栄養素と代謝老廃物を運びます。インスリンなどの生物の代謝の調節に関与します。ミオシンは細胞骨格の形成に使用され、タンパク質は免疫、細胞分化、アポトーシスなどのプロセスに関与しています。 タンパク質が細胞機能に関与するためには、特定の構造に折り畳まれる必要があります。しかし、配置や位置の違いにより、その種類は非常に多くなります。タンパク質が3次元空間で折り畳まれる方法は10^300通りあり、その構造は非常に複雑です。異なる折り畳み方法により、タンパク質の活性と生物学的特性が不確実になり、この複雑な特性により、タンパク質研究の道も困難になります。 タンパク質の構造を観察するための従来の主な方法は、核磁気共鳴法、X線法、クライオ電子顕微鏡法の3つですが、これらの方法は高価な機器と多くの試行錯誤を必要とすることが多く、各構造の研究には数年を要します。歴史的に、一部の科学者はタンパク質の明確な三次元構造を得るために数十年を費やしており、タンパク質の三次元構造の決定は生物学の分野で非常に困難な研究となっています。これまで、AI技術の支援がなければ、3次元構造が明確に確認できたのは17万個に過ぎず、これはタンパク質の総量と比較すると大きなギャップだ。 AI をタンパク質構造に適用する最新の進歩、つまり AlphaFold2 モデルと TRFold モデルでは、従来は数十年かかっていたタンパク質構造を、数日または数分で高い信頼性で予測できます。従来の測定方法と比較して、高速であるだけでなく低コストでもあり、ハイスループットのタンパク質構造取得に非常に適しています。研究によると、現在のペースが続けば、今年末までに1億3000万個のタンパク質構造の予測が完了し、生命科学の研究プロセスが完全に変わる可能性があるという。 これはまた、AI による大規模なタンパク質構造予測が科学研究者にとって重要なツールとなり、構造の観点から新たな科学的問題に答え、科学研究に新たなアイデアをもたらすことを意味します。例えば、研究者は、構造解析を通じて機能が未知のタンパク質分子や新たに発見されたタンパク質に機能注釈を付け、その機能を確認するための生物学的実験の設計を導くことができます。また、タンパク質の構造を解析して機能単位やドメインを特定したり、遺伝子操作のターゲットを提供したり、新しいタンパク質を設計したり既存のタンパク質を変更したりするための信頼できる基盤を提供したりすることも可能です。 Tianrang チームが開発した TRFold などの AI モデルは、タンパク質の構造と機能の問題に焦点を当てた生物学的コンピューティングの分野における革新的な研究の発見と探索の余地をさらに広げ、この分野の発展をより速いペースで促進することができます。 AI モデルは、生物学的構造のサポートに加えて、医学や薬理学の研究プロセスでも活躍する余地があります。 ウイルス構造の迅速な解析と医薬品開発期間の短縮 新薬の研究開発は、人類の発展において最もリスクが高く、複雑で、時間のかかる技術研究分野の 1 つです。タフツセンターの統計報告によると、市場に成功裏に投入される新薬を開発するには、平均26億ドルと約10年かかるという。コストが高いのは、医薬品の研究開発における失敗率の高さに関係しています。過去 10 年間、第 1 相臨床試験から FDA 承認までの医薬品開発プロジェクトの平均成功率は 7.9% でした。 人工知能技術の発展により、AIを応用した一部の新薬開発ではコストが35%削減され、研究開発サイクルは5〜10年から1〜3年に短縮されました。実際、医薬品の開発は体系的なプロジェクトです。このシステムでは、AI 技術により、医薬品開発プロセスにおけるスクリーニングや設計の最適化などの中核的な問題点をターゲットにし、試行錯誤ややり直しの時間を大幅に削減し、医薬品開発のコストを節約できます。 TRFold モデルは、いくつかの疾患関連タンパク質の構造を低コストで予測し、薬物再配置、仮想スクリーニングなどの方法を通じてこれらの疾患に対する潜在的な薬剤を見つけることができます。例えば、白皮症や骨形成不全症などの希少疾患の場合、再発率が低く、患者のほとんどが貧困層であるという事実から、製薬会社から注目されることはありません。中国だけでも、この病気に苦しむ患者は2,000万人を超えます。顧みられない病気は世界中の全疾病の 12% を占めていますが、新たに開発される医薬品のうち顧みられない病気を対象とするものはわずか 1.1% です。現在、AlphaFold2やTRFoldなどのAIモデルは、このような疾患の治療薬の開発に希望をもたらしています。タンパク質の構造を迅速かつ正確に予測することで、新しい薬物分子の設計に適切な標的分子と構造を提供し、貧困層にほぼ独占的に集中している疾患に対する薬物の開発を可能にします。 新薬の臨床試験では、TRFold モデルは「毒性早期警告システム」としても機能します。動物モデルは薬物の毒性を試験する上で非常に有用ですが、リスクの高いヒト臨床試験を実施する際にはリスクを軽減する必要があります。そうでなければ、予期せぬ毒性の副作用により新薬は臨床研究から撤退することになり、これまでの努力がすべて無駄になってしまいます。一般的な解決策は、人間の生物学を厳密に模倣するシステムを開発することですが、これはまだ実現が困難です。 TRFold のような AI モデルは、人間のタンパク質の 3D モデルを提供し、より優れた人間のバイオシミュレーション システムの構築に役立つ可能性があります。 もちろん、細菌やウイルス関連のタンパク質構造研究においても、TRFold モデルは、タンパク質タイプの機能解析の範囲と下流アプリケーションを拡大し、一部のウイルス感染症の研究、抗生物質や標的薬の開発、新しい効率的な酵素の研究開発など、薬物研究と健康に貢献します。 しかし、タンパク質構造の極めて高い精度を要求する研究はまだ数多くあります。たとえば、ヘモグロビン中の鉄イオンの変位は、数十分の1オングストロームのスケールで議論されます。構造の詳細をこのように細かく分析する場合、予測された構造は議論の基礎として機能しません。わずかな不確実性によって、まったく異なる結論が導かれる可能性があるからです。 AIモデルのアルゴリズムの普遍性や精度にはまだまだ改善の余地があり、タンパク質とそのリガンドの複雑な構造やタンパク質の動的解析などの分野でのアルゴリズムの改善が必要です。 AI予測モデルが生命情報の奥深くまで入り込む AI モデルを使用して単一タンパク質の構造シミュレーションを予測することは、ほんの始まりに過ぎません。構造の予測は研究の方向性を示すだけです。その後の進歩には、依然として実験とブレインストーミングが必要です。 AI モデルでは予測・発見できない構造もいくつかあり、その研究は謎のままであり、科学研究者、企業、研究機関にも多くの余地を残しています。 国内外のさまざまなタンパク質構造予測モデルは、それぞれが専門分野を持ち、生命科学やバイオテクノロジーの広大な分野で役割を果たしていきます。中国科学院の構造生物学者で院士の石一公氏はかつて、AI予測モデルについて次のように見解を述べた。「ヒトプロテオームで予測できるタンパク質の3次元構造は、基本的にAlphaFoldによって予測されている。全体的に、予測結果は信頼性が高く、比較的正確である。これは人類の自然科学的探究における非常に注目すべき歴史的成果であり、21世紀に人類が成し遂げた最も重要な科学的ブレークスルーの1つでもある。」 AlphaFold2 がタンパク質構造予測における大きな進歩であることは疑いの余地がありません。こうした AI モデルによって予測される高品質なタンパク質構造は、化合物の効率的なスクリーニングや医薬品開発のライフサイクル全体にわたる新しい技術の開発を促進するでしょう。 AlphaFold 2 モデルのパフォーマンスは十分に強力であるのに、なぜアルゴリズムを自分たちで作成するためにエネルギーと頭脳を費やさなければならないのかと疑問に思う人もいるかもしれません。実際、Deepmind は AlphaFold 2 モデルをオープンソース化していますが、オープンソース化されているのはトレーニング コードではなく推論コードです。したがって、GitHub からダウンロードしたコードは、実際には AF2 モデル アルゴリズムを実行し、タンパク質構造を直接予測することしかできません。タンパク質の構造と機能の問題に焦点を当てたり、実際のアプリケーションの精度要件を達成できる AI アルゴリズムを開発したりする場合、モデルのトレーニング経験や AlphaFold 2 モデルの結果をトレーニングする能力がなければ、このテクノロジーを進化させてより深い問題を解決することはできません。 チップと同様に、タンパク質構造予測の中核となる技術的能力がなければ、生命科学のより深い領域への探究は制限されてしまいます。 Tianrang チームによって作成された TRFold アルゴリズム プラットフォームは完全に国内で開発され、最下位レベルのコードからゆっくりと構築されています。国際大会では、AlphaFold 2 モデルに次ぐ好成績を収めています。 2年半の研究開発期間中、TRFold は何十ものバージョンを経て改良されてきました。現在のトレーニング アーキテクチャは今年の初めに設計されました。データを処理し、データをトレーニングし、継続的に反復して最適化するには 10 か月かかりました。最新バージョンの予測精度はAlphaFold2に近く、超大規模な計算能力を必要とするAlphaFold2のボトルネックを突破しました。 AlphaFold2 モデルとは異なり、TRFold には独自の考え方と設計があります。 TRFold は重み共有を使用して計算能力を節約します。トレーニング リソースとコンピューティング能力が限られているため、Tianrang チームは、トレーニングに少量の実際のデータのみを使用して、データとネットワーク設計を改善しました。これにより、モデルはトレーニング中に実際の共進化情報をより適切に認識できるようになり、アミノ酸残基の距離と座標のより正確な予測結果を実現できます。 計算電力消費量は AlphaFold2 の約 1/32 で、ほとんどのタンパク質鎖を予測するのに 16 秒もかかりません。 AlphaFold2 が約 400 個のアミノ酸からなるタンパク質鎖を予測するのに 70 秒以上かかることと比較すると、小規模なサンプル データのトレーニングと生成には明らかな利点があります。その後のタンパク質相互作用ネットワークの構築プロセスでは、計算量が指数関数的に増加するため、タンパク質構造予測の研究は大きな意義を持ちます。また、構造生物学や医薬品研究などの分野での国内の徹底的な研究への扉も開きます。技術的な制限があるため、他者に頼ることはありません。 Tianrang チームの TRFold モデルにも独自の開発方向があり、タンパク質の構造と機能の問題に焦点を当て、実際のアプリケーションの精度要件を満たすことで、より深い問題の解決を促進します。たとえば、タンパク質間の相互作用を研究する場合、現在の全プロテオーム共進化解析を使用して、タンパク質間の相互作用間の正確なリンクを確立することができます。タンパク質間の相互作用を研究することで、研究者は大規模な相互作用ネットワーク マップを構築し、薬物結合ターゲットの新しいアイデアや、精密な疾患治療のための新しい方法を発見できるようになります。新薬開発、抗体シミュレーション、その他のワクチン開発において、タンパク質設計の精度と成功率を向上させ、新型コロナワクチンなど各種ワクチンのタンパク質設計の検証に役立ちます。 科学の歴史を振り返ると、科学研究におけるあらゆる大きな進歩は、当時の技術のサポートと切り離せないものでした。タンパク質の精製が困難な時代であろうと、電気の目でタンパク質を観察するクライオ電子顕微鏡の時代であろうと、科学者が研究に使用するツールは、その時々の最高レベルの技術に依存しています。 AI技術の継続的な進歩により、最先端の生命科学の深海と未知の領域をリードするDeepMindやTianrangなどの企業は、AI技術を活用して研究者の科学研究を支援し続けており、研究者はタンパク質構造を予測するために人間の事前知識に頼る必要がなくなりました。 近い将来、AI の巨人たちの力を借りて、この分野の発展は確実に質的な飛躍を遂げるでしょう。タンパク質は生命のプロセスに影響を与える高分子です。 AIアルゴリズムモデルは、生命科学の分野に新たな世界を開きました。これらの巨大なタンパク質構造はテクノロジーによって公開され、その背後にある解釈と分析には生命情報の「豊かな鉱山」が含まれており、私たちが探索して採掘するのを待っています。 |
>>: 詳細 |消費者革命は到来したのか?テイクアウト用のリサイクル可能な食器が米国でトレンドになりつつある
製造ロボット、組立ロボット、3Dプリントロボットなどは聞いたことがあるかもしれませんが、「飼育ロボッ...
リンゴはミネラルやビタミンが豊富で、最も一般的に消費される果物です。リンゴは食物繊維が豊富で、腸内細...
レモンは私たちの多くがとても好んで食べる果物の一種です。栄養価が高く、人間の健康を促進するのにも非常...
【中国・北京、2024年4月24日】2024年(第18回)北京国際自動車展示会の前夜、ファーウェイの...
1. 焼きすぎた肉を食べないどのような肉を食べるにしても、柔らかく煮込むほど美味しいと感じます。こ...
重曹は私たちの生活の中でよく使われています。例えば、多くの人の歯は少し黄色くなっています。歯を磨く前...
『哪吒~魔の子が竜王を征く~』では、敖冰と沈正道(沈公寶の父)が滝の下で激しく戦った。沈正道は稲妻...
現代生活では、料理をするときに油は欠かせません。どんな料理でも、多かれ少なかれ油と切り離すことはでき...
ファーストフードは非常に一般的であり、ファーストフード店はオフィスワーカーにとって一般的な選択肢です...
植物の中国語名は洗練されたコードのようなもので、生物学的な用語による長々とした説明を必要とせず、植物...
ホッキョクグマは地球上で最も象徴的な動物の一つであり、世界最大の陸生肉食動物です。陸上で生まれますが...
ビワは生活の中でとても一般的です。ビワは広く使用されています。ビワを選ぶときは、自分の好みに応じて使...
我が国は農業大国として、農業は国の基盤であるとともに、強い国となるための道でもあります。少し前に、「...
食は人間にとって必要不可欠であり、すべての人の生存は食と切り離せないものです。各人が作る料理の味は調...
これまでたくさんの魚を食べてきたかもしれませんが、サーモンのような魚を食べることはめったにないかもし...