以下の記事はNature Portfolioからのもので、著者はNature Portfolioです。 今日のデジタル ペインティング テクノロジーでは、有用な生物学的分子のデザインをオンデマンドでカスタマイズできます。 「さあ、始めましょう。」ワシントン大学の計算化学者デイビッド・ユルゲンス氏は、過去30億年の進化の中で一度も現れたことのないタンパク質を設計することを計画している。 今朝のビデオ通話で、ユルゲンス氏は自身が開発に協力した人工知能 (AI) ツールである RFdiffusion のクラウド バージョンを公開しました。このニューラル ネットワークとその他の類似のツールにより、タンパク質のカスタマイズが主流の研究に導入されつつあります。これは最近まで困難で、失敗することが多かった偉業です。 RFdiffusionと呼ばれるAIツールは、副甲状腺ホルモン(ピンク色)に結合するタンパク質を設計しました。出典: イアン・C・ヘイドン/ワシントン大学タンパク質設計研究所 これらのタンパク質はワクチン、治療薬、生体材料の基礎となる可能性があります。 「これはまさに破壊的な瞬間だ」とマサチューセッツ州のバイオテクノロジー企業ジェネレート・バイオメディシンズの最高技術責任者、ゲヴォルグ・グリゴリアン氏は言う。バイオテクノロジー企業はタンパク質設計を医薬品開発に応用しようとしている。 これらのツールは、今年、デザイナーブランドの白いダウンジャケットを着た教皇の合成写真で話題となった「ミッドジャーニー」など、リアルな画像を合成できるAIソフトウェアからヒントを得ている。研究者らは、同様の概念を使用して、設計者の要件を満たす現実的なタンパク質の形状を生成できることを発見しました。つまり、別の生体分子にしっかりと結合する新しいタンパク質を迅速に設計することが可能になったということです。また、初期の実験では、研究者がこれらのタンパク質を合成すると、少数の有用なタンパク質がソフトウェアの予測どおりに動作することが示されている。 研究者らによると、過去1年間でこれらのツールはタンパク質設計プロセスに革命をもたらしたという。 「これは突然の能力の爆発だ」とニューヨークのコロンビア大学の計算生物学者、モハメド・アルクライシ氏は言う。彼のチームはタンパク質設計ツールを開発しました。 「望む機能を持つタンパク質を設計できるようになりました。」 「タンパク質の構造を問題に合わせて調整しているのです」とワシントン大学の計算生物物理学者デイビッド・ベイカー氏は言う。ベイカー氏のチームはRF拡散を開発したが、ユルゲンス氏もそのメンバーである。研究チームは2023年3月にソフトウェアをリリースし、ニューラルネットワークを説明する論文をNature誌に発表した[1]。 (この論文のプレプリントは2022年後半に公開されましたが、その時点ではAlQuraishi[2]やGrigoryanのチームを含むいくつかの他のグループも同様のニューラルネットワークを報告していました。) タンパク質設計者がこのような再現性と信頼性のあるツールを手にするのは今回が初めてであり、彼らはこれを活用して全く新しい産業を創出できるとグリゴリアン氏は語った。 「次の課題は、それを使って何ができるかということです。」 グランドデザイン ユルゲンス氏は、タンパク質に求める特性のいくつかを、オンラインの税金計算機に似たウェブフォームに入力した。それは 100 個のアミノ酸から成り、ホモ二量体と呼ばれる 2 つのタンパク質の対称複合体を形成します。多くの細胞受容体はこの構成を持っており、新しいホモ二量体は合成細胞シグナル伝達分子として機能する可能性があるとワシントン大学の計算生化学者ジョー・ワトソン氏は言う。 Watson は RFdiffusion の開発に協力し、本日のビデオ通話にも参加しました。しかし、今朝のデザインは、現実的なタンパク質をシミュレートするためだけに設計されたものであり、他の目的はありませんでした。 何十年もの間、研究者たちは新しいタンパク質の設計に苦労してきました。当初、研究者たちは、化学反応を触媒する酵素の一部など、既存のタンパク質の有用な部分を組み合わせようとした。このアプローチでは、タンパク質がどのように折り畳まれ、機能するかを理解する必要があり、直感と多くの試行錯誤に依存します。科学者は、期待に応える設計を見つけるまでに、何千もの設計をスクリーニングしなければならないことがあります。 ベイカー氏は、アミノ酸配列からタンパク質の構造を正確に予測できるAlphaFold(ロンドンに拠点を置くAI企業DeepMind、現在はGoogle DeepMindが開発)やその他のAIモデルの出現は希望の兆しだと語る。設計者は、実際のタンパク質配列と構造でトレーニングされたこれらのニューラル ネットワークを使用して、タンパク質をゼロから作成することもできることを発見しました。 ベイカー氏のグループと他のグループは、過去数年間にわたって AI ベースのタンパク質設計ツールをいくつかリリースしてきました。これらのツールは、幻覚と呼ばれる手法を使用します。これは、アミノ酸のランダムな鎖を作成し、それを AlphaFold や RoseTTAFold などのツールで最適化して、ニューラル ネットワークが特定の構造に折り畳まれると判断するものを形成するというものです。インペインティングと呼ばれる別のアプローチでは、特定のタンパク質配列または構造を取得し、RoseTTAFold を使用してその周りに分子の残りの部分を構築します。 ただし、これらのツールはまだ完璧ではありません。実験により、「幻覚」法を使って設計された構造は、研究室で合成されたときに必ずしも所定の位置に折り畳まれるわけではなく、試験管の底に物質の山として残ることが判明した。 「幻覚」法では、小さなタンパク質以外の生成物を生成することも困難です(ただし、他の研究者は2月のプレプリント論文で、この方法はより長い分子の設計に使用できると示唆しています[4])。 「修復」方法では、短い断片からタンパク質を形成することもうまくいきません。このアプローチでは理論的なタンパク質構造は得られますが、問題に対する異なる解決策を提供できず、成功の可能性は高まりません。 ここで、ここ数か月でリリースされた RFdiffusion や同様のタンパク質設計 AI ツールが登場します。これらは、Stable Diffusion、DALL-E、Midjourney など、リアルな画像を合成するニューラル システムと同じ原理に従います。これらの「拡散」ネットワークは、画像やタンパク質構造などのデータに基づいてトレーニングされ、トレーニング プロセスによってデータに「ノイズ」が加えられるため、最終結果は開始時の画像や構造とはまったく似ていないものになります。次に、ネットワークはデータの「ノイズ除去」を学習し、逆のタスクを実行します。 RFdiffusion などのネットワークは、Protein Data Bank (PDB) に保存されている数万の実際のタンパク質構造を使用してトレーニングされます。ネットワークが新しいタンパク質を設計するときは、完全なノイズ、つまりアミノ酸のランダムな組み合わせから始まります。 「このノイズを発生させているタンパク質が何なのかを知りたいのです」とワトソン氏は言う。数回のノイズ除去処理を経て、本物らしく見えるが実は全く新しいタンパク質が生成されます。 ベイカー氏のチームがタンパク質の長さ以外の指示を与えずに RFdiffusion をテストしたところ、ネットワークは PDB を使用してトレーニングしたものとはまったく異なる、本物らしく見えるさまざまなタンパク質を生成しました。 しかし、研究チームは、ノイズ除去プロセス(「コンディショニング」と呼ばれるプロセス)中に、特定の設計要件に従ってタンパク質を設計するようにプログラムを指示することもできました。 たとえば、ベイカー氏のチームは、RFdiffusion に、特定の折り畳み構造を持つタンパク質や、別の分子の表面に付着できるタンパク質 (結合の背後にある相互作用メカニズム) の設計を依頼しました。グリゴリアンのチームはまた、Chromaと呼ばれる拡散ネットワークを開発しました。これは、条件付けを通じて、英語のアルファベットの大文字26個とアラビア数字に似たタンパク質を設計することを可能にします[3]。 AIが英語のアルファベットに似たタンパク質を設計しました。出典: ジョン・イングラハム、ウージ・ワン、マックス・バラノフ、ゲヴォルグ・グリゴリアン ノイズ信号 ユルゲンスのコンピューター画面はノイズから始まります。つまり、AI システムはさまざまなランダムなアミノ酸配列から始まるということです。それは、子供が指で描いた絵画のような、赤くて乱雑な線でした。また、フレームごとに、アルファヘリックスと呼ばれる密ならせんやベータシートと呼ばれる逆向きのフィラメントなど、タンパク質のような特徴を持つより複雑な構造に変換します。 「これはアルファベータトポロジーの完璧な組み合わせです」とユルゲンス氏は、設計にわずか数分しかかからなかったタンパク質を見ながら語った。 「良さそうですね。」 ベイカーの研究室ではこのツールを使用しています。 「設計プロセス全体が1年前とは大きく異なっています」と彼は語った。ニューラル ネットワークは、他の方法では非効率的、困難、または成功しないタスクで優れた成果を上げることができます。 研究で報告された分析[1]では、研究チームは、免疫細胞が認識できるウイルスタンパク質の一部など、別のタンパク質の断片から始めて、AIツールに100種類の新しいタンパク質を生成させ、探しているモチーフがいくつ含まれているかを確認しました。チームは 25 種類の異なる初期形状を使用してこのタスクに挑戦しました。最終結果には必ずしも元の断片が含まれていなかったが、RF拡散法では23個の断片に少なくとも1つの標的モチーフを持つタンパク質が生成され、「幻覚」法では15個、「修復」法では12個であった。 RF拡散は、薬剤やワクチン成分を送達できる複雑なナノ粒子に自己組織化するタンパク質を設計できることも示されています。これまでのAI手法[5]でもこのタイプのタンパク質を設計することは可能でしたが、ワトソン氏はRFdiffusionの設計の方がより洗練されていると考えています。 RFdiffusion のようなニューラル ネットワークは、別の特定のタンパク質に結合できるタンパク質を設計するのに優れているようです。ベイカー氏のチームはこのネットワークを利用して、がんや自己免疫疾患などの疾患に関与するタンパク質に強く結合するタンパク質を設計した。彼によると、成功した実験の 1 つでは、標的にするのが難しい免疫シグナル分子にしっかりと結合するタンパク質を設計した。この標的は、抗体医薬品で毎年数十億ドルの収益を生み出すターゲットである。 「これにより、それに結合するタンパク質の範囲が広がり、有用な治療薬の開発につながる」とワトソン氏は語った。 実世界テスト ベイカー氏のチームが非常に多くのタンパク質を設計したため、それらが意図した機能を持つかどうかをテストするのは困難な作業となった。 「1つの機械学習アルゴリズムは、生物学者100人が何ヶ月もかかるようなタンパク質を設計できる」と、マサチューセッツ州のマイクロソフト研究所で生物医学機械学習を研究する研究者ケビン・ヤン氏は言う。[6] しかし、RFdiffusion のデザインは本物だという初期の兆候が見られます。彼らが説明する別のタスクでは、ベイカー氏のチームはこのツールを使って、多くの癌で過剰に活性化するシグナル伝達分子(そして魅力的な薬剤ターゲット)であるp53の重要な断片を含むタンパク質を設計した。研究チームがソフトウェアによって設計された 95 種類のタンパク質を合成したところ (細菌を操作してそれらを発現させる)、その半分以上が p53 をその天然の標的である MDM2 に結合する能力を持っていました。最適な設計により、天然の p53 よりも 1,000 倍以上強力に結合します。研究者が「幻覚」アプローチを使用する場合、設計は機能すると予測されるが、試験管内では機能しない、とワトソン氏は述べた。 ベイカー氏は、全体として、RFdiffusion の設計の 10 ~ 20% が意図したターゲットに密接に結合し、有用な効果を生み出したことをチームが発見したが、AI 以前のアプローチでは成功率は 1% 未満だったと述べた。 (これまでの機械学習アプローチでは、結合タンパク質を確実に設計できなかったとワトソン氏は言う。)ワシントン大学の生化学者で同僚のマティアス・グローグル氏は、最近の成功率は50%に近づいており、有用な設計を得るのに数か月ではなく、わずか1、2週間しかかからないかもしれないと語る。 「ちょっとおかしいですね」と彼は言った。 拡散ベースの AI 描画ジェネレータによってノイズを使用して設計された漏斗状のタンパク質アセンブリ (上段) と 6 つのタンパク質鎖を持つリング構造 (下段)。出典: イアン・C・ヘイドン/ワシントン大学タンパク質設計研究所 ハーバード大学の進化生物学者セルゲイ・オブチンニコフ氏によると、6月末までにRFdiffusionのクラウド版のユーザー数は1日あたり約100人に達したという。オーストラリアのシドニー大学の生化学者ジョエル・マッケイ氏は、細胞内の遺伝子活動を制御する転写因子など、研究対象となっている他のタンパク質と結合できるタンパク質を設計するためにRF拡散を利用しようとした。彼は設計プロセスが単純であることに気づき、コンピューターモデリングを使用して、タンパク質が理論的に転写因子に結合できることを確認しました。 マッケイ氏は現在、これらのタンパク質が細胞内で生成された場合、予想通りに遺伝子発現を変化させることができるかどうかをテストしている。彼は、すべてがうまくいくことを望んでいる。なぜなら、このような発見は、開発に何年もかかる薬剤を必要とせずに、細胞内の特定の転写因子のオンとオフを切り替える簡単な方法を提供する可能性があるからだ。そもそも、そのような薬剤が開発できるかどうかはわからないが。 「この方法が私たちのタンパク質に有効であれば、状況は一変するだろう」と彼は語った。 将来の最適化 英国オックスフォード大学の免疫情報学者シャーロット・ディーン氏は、RF拡散などの最新モデルは「飛躍的進歩」だと語る。しかし、重要な問題は未解決のままです。 「これによって、こうした普及モデルの可能性に人々の目を向けさせることができる」と彼女は語った。 彼女や他の科学者、バイオテクノロジー企業が興味を持っている応用例の 1 つは、免疫細胞の一種である T 細胞が使用する抗体やタンパク質受容体など、より複雑な結合タンパク質を設計することです。これらのタンパク質は、ターゲットと連結できる柔軟なコイル構造を持っていますが、RF拡散は現時点では、平らなサンドイッチのようなインターフェースに最適です。ベイカー氏は抗体に関しては進歩があったと述べた。 オブチンニコフ氏らは、一般的に、機能がさまざまな形に折り畳まれる緩い領域に依存する生体分子の場合、この種の設計はより困難であると考えています。これらの特性は、AI を使用してシミュレートするのが難しいことが判明しています。 「何か他のものと組み合わせて抑制できるかどうかが問題であれば、これらの方法を使ってその問題を解決できます。しかし、自然現象のシミュレーションなど、より複雑なタスクを実行したい場合は、柔軟性を追加する必要があります。」とオブチンニコフ氏は述べた。 カリフォルニア大学サンフランシスコ校の計算生物学者 Tanja Kortemme 氏は、RF 拡散を利用して、細胞を制御するセンサーやスイッチとして機能するタンパク質を設計しています。同氏によると、タンパク質の活性部位が少数のアミノ酸の配置に依存する場合にはAIネットワークはうまく機能するが、より多くの重要なアミノ酸を必要とするより複雑な活性部位を持つタンパク質を設計するのは困難で、同氏と同僚はこの問題の解決に取り組んでいるという。 ヤン氏は、最新の拡散モデルのもう一つの限界は、天然のタンパク質とは根本的に異なるタンパク質を設計できないことだと述べた。これらのAIシステムは研究者が特徴付けた既存のタンパク質に基づいて訓練されているため、設計するタンパク質は「模倣品」だと同氏は述べた。珍しい外観を持つタンパク質を設計するには、タンパク質に機能を与える物理的メカニズムをさらに理解する必要があるかもしれません。 「これにより、天然のタンパク質ではできない機能を実行できるタンパク質の設計が容易になります」とヤン氏は言う。 「まだ改善の余地は大いにある」 アルクライシ氏は、最新のタンパク質設計ツールは、タンパク質が結合する表面などの構造の観点から機能を説明できる限り、特定のタスク向けのタンパク質を設計するのに非常に強力であることが証明されていると述べた。しかし彼は、RFdiffusion のようなツールでは、どのような形状であっても特定の反応を実行するタンパク質を設計するなど、他の機能はまだ処理できないと指摘しています。つまり、何が欲しいかはわかっていても、その形状がどうあるべきかはわからないのです。 グリゴリアン氏は、将来のタンパク質設計ツールは、さまざまなニーズに応じてタンパク質を設計できる必要があると述べた。潜在的な治療用タンパク質は、標的に結合するだけでなく、他の標的に結合せず、大量生産が容易でなければなりません。 研究者たちが探究している方向性の一つは、Midjourney のような画像生成ツールに与えられるプロンプトのように、これらのタンパク質の設計を平易な言葉で説明できるかどうかだ。 「タンパク質の説明を書き留め、それを合成してテストする様子を想像してみてください」とワトソン氏は語った。 グリゴリアン氏とその同僚たちは、この目標に向けて一歩を踏み出しました。 2022年12月に発表されたプレプリント論文[3]では、Chromaに説明をデザインに組み込み、「CHADドメインを持つタンパク質」(複数のヘリックスを組み合わせたタンパク質構造)や「アミノトランスフェラーゼの結晶構造」(タンパク質の合成と分解に関与する酵素)などのテキスト説明に基づいてデザインを生成するようにトレーニングしました。 ユルゲンス氏が今朝数分かけて設計したタンパク質は、タンパク質の 3D 構造のモデルにすぎません。その後、ユルゲンス氏は別の AI ツールを使用して、この構造に折り畳むことができるアミノ酸配列を取得しました。最終チェックとして、彼は配列を AlphaFold に入力し、ソフトウェアが彼の設計に一致する折り畳まれた構造を予測できるかどうかを確認しました。結果はまったく同じで、AlphaFold の予測は設計された構造と平均でわずか 1 オングストローム (水素原子の幅) しか異なっていませんでした。 「このレベルの精度があれば、これは成功した設計だと言える」とワトソン氏は語った。残された課題は、タンパク質が現実世界でどのように機能するかを確認することだけです。 参考文献: 1. ワトソン、JL 他ネイチャー https://doi.org/10.1038/s41586-023-06415-8 (2023). 2. Lin, Y. & AlQuraishi, M. プレプリント、https://arxiv.org/abs/2301.12485 (2023)。 3. イングラハム、J. 他bioRxivのプレプリントhttps://doi.org/10.1101/2022.12.01.518682(2022年)。 4. フランク、C. 他bioRxivのプレプリントhttps://doi.org/10.1101/2023.02.24.529906(2023年)。 5. Wicky、BIM 他サイエンス378、56–61 (2022)。 6. Wu, KE プレプリント https://arxiv.org/abs/2209.15611 (2022)。 元の記事は、2023年7月11日にネイチャーのニュース特集セクションに「AIツールが医療を変革する可能性のあるまったく新しいタンパク質を設計している」というタイトルで掲載されました。 © 自然 土井: 10.1038/d41586-023-02227-y 著作権に関する通知: この記事はSpringer Nature Shanghaiによって翻訳されました。中国語コンテンツは参考用です。すべてのコンテンツはオリジナルの英語版に準拠します。この記事をあなたの友人の輪に転送していただいても結構です。転載をご希望の場合は、[email protected] までメールでご連絡ください。無許可の翻訳は著作権侵害であり、著作権所有者は法的責任を追及する権利を留保します。 © 2023 Springer Nature Limited 無断複写・転載を禁じます。無断転載を禁じます |
<<: 二十四節気の食べ物シリーズ | 「冷えと乾燥」にはどう対処すればいい?寒露の時期に健康を保つためのヒント
>>: 主人公はすごくかっこいいですか?彼らも労働者かもしれません!
多くの人が旅行が好きです。その理由のほとんどは、遊びたいからではなく、中国は広大な国であり、私たちを...
「Body Code Decoding Bureau」(公開アカウント:stmm163)をフォロー...
出典: 簡単な歴史この記事は承認されました。転載については原著者にお問い合わせください。この記事の表...
iClickは、「中国のオンラインショッピング市場の新トレンド」と「パーソナルケアと化粧品のオンライ...
9月14日、百度副社長兼インテリジェント運転事業グループゼネラルマネージャーの李振宇氏は「百度アポ...
ジャガイモは芋類や山芋卵とも呼ばれ、色によって紫芋、赤芋、黒芋、白芋などに分けられます。ジャガイモは...
食べ物は空腹を満たすためだけではなく、私たちの体を整えるのに役立つ良い助けでもあります。利尿作用のあ...
付録: 1. 一緒にお風呂に入るのは素敵だと思いますが、実は映画やテレビ番組の影響がほとんどです。現...
鶏の手羽先は鶏のより良い部分です。鶏の手羽先には皮、筋肉、骨が含まれます。鶏の手羽先は鶏の体の中で最...
長城汽車の高級ブランドWEYに関するニュースは長い間流れている。この度、VV7CとVV7Sの2つのモ...
誰かに、よく知っているゲームメーカーを 3 つ挙げるように頼んだ場合、コンソール プレイヤーは So...
マツタケは海外でよく見られる菌類で、主に日本の食卓では珍味として食べられています。独特の味がするだけ...
著者: 胡景文、三峡大学基礎医学部黄一玲、三峡大学基礎医学部准教授イラスト:王慧平、胡景文、三峡大学...
物理学者が持つあらゆるツールの中で、描画(スケッチ)は常に一般的でありながら非常に効果的なものであり...
夏に私たちが最もよく食べるものは、おそらく冷たい食べ物でしょう。特に料理をするときは、面倒なことはし...