「バイオコンピューティング」とは何ですか?中国はなぜ遅れをとれないのか?

「バイオコンピューティング」とは何ですか?中国はなぜ遅れをとれないのか?

バイオコンピューティングとは何ですか?

科学者がタンパク質の構造を研究していると言ったら、ほとんどの人は次のようなイメージを思い浮かべると思います。科学者は白衣を着て顕微鏡の前に座り、熱心に観察しています。これが生化学者の標準的なイメージとなっているようです。ところが、ある日、彼のオフィスに行ってみると、顕微鏡も試験管も見当たらないことに気づきました。彼がゆったりとした着心地の良いカジュアルな服を着て、コンピューターでコードを入力している姿しか見えません。この光景は多くの人を驚かせるに違いない。実際、より正確に言えば、この科学者はバイオコンピュテーショナリスト(または計算生物学者)です。彼の研究対象は確かにタンパク質や DNA などの微小な生物学的活性物質ですが、従来の生化学者と異なるのは、彼の研究ツールが試験管や顕微鏡ではなく、コンピューターであるという点です。

多くの人は、「X 社がバイオコンピューティングに参入」といったニュースの見出しを初めて目にしたとき、強い畏敬の念を抱きます。同社が、SF映画に登場する電極が詰まった柔らかい脳組織のように、生物活性物質を使ってコンピューターを作ろうとしているのではないかと考える人もいた。

これは大きな誤解です。これらのニュースが実際に伝えているのは、ある企業が、限られたタンパク質情報に基づいてタンパク質の3次元構造を正確に描くことができるAIアルゴリズムを設計したいと考えているということです。比喩的に言えば、この会社は、被害者の説明に基づいて殺人犯の容姿を正確に描写できるプログラムを警察が設計するのを手伝っているのと同じことだ。タンパク質の立体構造を描くことは、新型コロナウイルスのワクチン開発など、新薬開発に大きな意義がある。しかし、この問題も極めて困難であり、今日の人類科学が直面しているいくつかの重大な課題の 1 つです。なぜそれが難しいのか、そしてなぜそれが重要なのかを知るには、読み進めてください。

タンパク質の折り畳み問題

微視的な視点から見ると、タンパク質は大きな有機分子の集まりです。それは人生の基本的な部分です。各タンパク質は特定の三次元構造を持っていますが、この三次元構造には、長い鎖から折り畳まれなければならないという特別な特徴があります。タンパク質の立体構造がどのようなものかを知るには、「マジックルーラー」という子ども用のおもちゃで遊んでみればすぐに理解できます。マジックルーラーはセクションで構成されており、各セクションはさまざまな角度に反転できます。そのため、長いマジック定規をさまざまな形に折ることができます。魔法の定規のセクションが増えるほど、折りたためる図形の数は飛躍的に増加します。

タンパク質の基本単位はアミノ酸で、魔法の定規の「結び目」のようなものです。タンパク質が最初に生成されるとき、それは数十から数百のセクションを持つ長い魔法の定規のようなものです。その後、数マイクロ秒から数ミリ秒以内に特定の形状に急速に折り畳まれます。そのため、電子顕微鏡で見ると、それぞれのタンパク質は絡み合った状態のように見えます。

したがって、タンパク質の特性と機能を決定するのは、タンパク質を構成するアミノ酸配列と、タンパク質が最終的に折り畳まれる形状です。たとえば、私たちの免疫システムは、ウイルスや細菌の侵入に直面すると、「Y」字型の抗体タンパク質を生成します。これらはクレーンゲームの爪のような形をしており、侵入者を正確に狙って捕まえることができます。

画像: ウイルスを標的にして認識する抗体

私たちの靭帯、骨、皮膚の間にはコラーゲンが豊富に存在します。その形は3本の太いロープで編んだようなもので、肌に張りを与え、弾力性があるように見えます。

図: ねじれた形のコラーゲン

例えば、2020年にノーベル賞を受賞した遺伝子部位特異的編集技術であるCRISPRも、カニの爪のようなCAS9タンパク質を利用しています。ゲノム内の特定の DNA 領域を「しっかりと固定」し、切断を引き起こします。

画像: カニの爪のような CAS9 タンパク質 (オレンジ) が DNA (緑) をしっかりと固定します

したがって、科学者はタンパク質に関する 2 つの情報に最も興味を持っています。1 つはタンパク質のアミノ酸配列で、これは魔法の定規の「ノード」として考えることができます。もう1つはタンパク質の構造で、折りたたんだ後の魔法の定規の形状です。配列情報は比較的簡単に入手できますが、構造情報を入手するのは非常に困難です。しかし、構造情報はさらに重要です。未知のタンパク質の構造を知ることで、細胞内でのその役割をより正確に理解するのに役立つからです。このタンパク質が特定の病気に関連している場合、科学者はその構造形状に基づいて対応する薬を開発することができます。 1972年、ノーベル化学賞受賞者のクリスチャン・アンフィンセンは、実はたった1つの情報さえ知っていればよいという仮説を提唱しました。なぜなら、彼は実験で、タンパク質の配列が変化せず、常に同じ化学環境にある限り、タンパク質は毎回同じ三次元構造に折り畳まれることを発見したからです。したがって、タンパク質が 3 次元空間でどのように折り畳まれるかに関する情報は、実際にはそのアミノ酸配列に含まれています。つまり、タンパク質のアミノ酸配列がわかれば、理論的にはその三次元構造を推測できるはずです。

アンフィンセン氏の仮説は世界中の同僚たちに認められている。しかし、科学者たちはすぐに、この理論を知っても何の役にも立たないことに気付きました。ネットでよく使われるフレーズを使うと、違いはありません。タンパク質のアミノ酸配列は実験室で比較的簡単に決定できますが、この配列がわかっても、特定の物理法則に基づいてその三次元構造を正確に推測することはできません。科学者たちはこれを50年近く研究してきましたが、今日までタンパク質の折り畳みの法則を完全には理解していません。この問題は生化学界では「タンパク質折り畳み問題」として知られており、21 世紀の人類科学が直面する大きな課題の 1 つです。

金を燃やす産業

今日の科学者がタンパク質の三次元構造を解明する唯一の方法は、膨大な人的資源と物質的資源を費やし、極めて不器用な方法を使用し、タンパク質の三次元構造を見つけるために多数の反復実験を行うことです。クライオ電子顕微鏡、X線結晶回折計、核磁気共鳴装置など必要な実験装置はいずれも高価です。例えば、クライオ電子顕微鏡の価格は数百万から数千万元の範囲になります。構造を分析するプロセスがスムーズに進むかどうかは、主に運次第です。運が悪ければ、実験を何千回繰り返しても結果が得られない可能性があります。したがって、タンパク質構造を解明するためのコストは通常​​、数万ドルから数十万ドルの範囲になります。

前世紀の終わり以来、IBM が率いるいくつかのコンピューター技術企業は、スーパーコンピューターを使用してアミノ酸配列に基づいてタンパク質の 3 次元構造を予測するという大胆なアイデアを提案してきました。これは、もともと試験管内で行われていた実験を、コンピューターのデジタル空間に移すことに相当します。このアイデアは当時としては非常に大胆かつ先進的なものでした。なぜなら、当時のコンピューターでは必要な計算量が天文学的な数字だったからです。タンパク質の折り畳みを予測するにはなぜこれほど多くの計算が必要なのか、不思議に思うかもしれません。大まかに言えば、計算プロセスは宝くじ箱で賞品を引くようなものです。 100 個のアミノ酸を含むタンパク質を 100 個のセクションを持つ魔法の定規として想像すると、約 10^94 種類の異なる形状を作り出すことができます。この数は宇宙全体の素粒子の数をはるかに超えています。コンピュータが実際に行うのは、消去法のプロセスです。特定のルールに従って、まず特定の種類の絶対に不可能な構造が一括して排除され、その後、タンパク質が示す特性に基づいて 1 つずつ排除されます。最終段階では、巨大な宝くじ箱から絶えず抽選するようなものとなり、抽選ごとに膨大な計算能力が必要になります。

IBMは5年をかけて研究開発を行い、2004年についに世界最大のスーパーコンピュータ「Blue Gene」を発売したと発表しました。その主な目的は、タンパク質の折り畳みの問題を解決することです。しかし、事態はコンピューターの専門家が予想したほど楽観的には進まなかった。 10年後、Blue Gene の3世代にわたるアップグレードを経ても、スーパーコンピューターは依然として試験管、X線結晶回折、核磁気共鳴に取って代わることができていません。 IBMも残念ながらBlue Geneシリーズの開発を中止した[1]。

しかし、IBM の失敗は、タンパク質構造のコンピューター シミュレーションの失敗を意味するものではありません。それどころか、IBM の推進により、このチャレンジに参加するチームはますます増えており、成果もますます豊富になっています。問題を解決するさまざまな素晴らしい方法が次々と登場しますが、最も興味深い例はワシントン大学のデイビッド・ベイカー教授の発明です。

2008年に彼のチームは「Foldit」というパズルゲームを開発しました。このパズルゲームの内容は、ユーザーが直感に基づいてタンパク質を折り畳み、特定のルールに従ってポイントを獲得できるようにすることです。結果は非常に有望なものでした。生物学者を15年間悩ませてきたサルのHIV関連タンパク質がパズルとしてゲームにアップロードされた後、プレイヤーはわずか10日間でそのタンパク質の最も可能性の高い折り畳み方法を解読することに成功した。

図: サルのHIV関連タンパク質

1994年以来、CASPと呼ばれる国際的なタンパク質構造予測コンペティションが誕生しました。 2年ごとに開催されるこのイベントには、参加チームがますます増え、世界中の多くのテクノロジー界の巨人が参加しています。このコンテストでは、審査員が各チームの予測構造を 100 点満点で採点します。 2020年12月に終了した第14回大会で衝撃的なニュースが飛び込んできた。かつて有名な囲碁プログラム「AlphaGo」を開発したGoogleの人工知能チームが、自ら開発した「AlphaFold」プログラムで92.4ポイントを獲得し優勝したのだ。前回も優勝したが、得点は60点未満だった。この改善のスピードは衝撃的です。 AlphaFold によって予測されたタンパク質構造はすでに実際の実験の結果に非常に近いものであり、人間がコンピューターでタンパク質の折り畳み問題を克服するまであと一歩です。

中国は参入すべき

ここまでで、「生物学的コンピューティング」についての基礎的な理解が得られたはずです。前回の記事であれだけ話した後、中国については一度も触れられなかったことにお気づきでしょうか。このような重要な科学的取り組みは、過去数十年間、基本的に外国人によって行われており、私たち中国人はそれに何ら関与してきませんでした。本当に困った気持ちになります。新薬開発、ワクチン開発、精密医療、その他の生物医学技術の将来については、生物学的コンピューティングをマスターする者が世界を支配するだろうとほぼ確信を持って言えます。従来の試験管と電子顕微鏡の研究開発モデルは、最終的には AI に置き換えられるでしょう。この科学研究事業は国家戦略のレベルにまで高められるべきである。

ソース

1. https://en.wikipedia.org/wiki/IBM_Blue_Gene

出典:サイエンスボイス

著者: 王傑

<<:  電子のわずか15万分の1の質量しかないこの謎の「透明人間」は、私たちの体に簡単に侵入することができます。

>>:  漢の文帝陵のほかに、教科書を書き換えるような大きな発見は何かありますか?

推薦する

女の子のためのカクテル

ワインは古代から現代に至るまで、中国における文化的象徴となっているようです。広大な領土と豊富な資源を...

「中国の空の目」、新着ニュース →

2023年7月26日(北京時間)国家重点研究開発プログラム「知能ロボット」重点プロジェクト「FAS...

学術界における性差別に立ち向かう:女性科学者が少なすぎると、すべての女性の健康に影響が出る

永遠の女性よ、私たちを上へ導いてください。 Das ewige weibliche zieht un...

紫キャベツの作り方

紫キャベツは、通称「紫キャベツ」とも呼ばれています。色が紫色で、形がキャベツに似ていることから「紫キ...

大手プラットフォームが公開している「IPロケーション」は、あなたの現在地を正確に教えてくれるのでしょうか?

Weiboや他の多くのオンラインプラットフォームではユーザーのIPロケーションが表示され、白熱した...

春になり花が咲く時期には凍結融解による地質災害が発生する可能性もあるため、特に注意が必要なエリアが 2 つあります。

土砂崩れは雨季にだけ起こると思っているなら、それは間違いです。私の国の北部と北西部では、春が満開にな...

あなたが知らない魔法のグレープフルーツの皮の栄養価

江西省の人々はスイカや冬瓜の皮だけでなく、グレープフルーツの皮も食べます。文旦の皮にはわずかに苦味が...

健康な妊娠を助けるおいしいナッツ4種

妊娠中の栄養はどうやって確保するのでしょうか?妊娠中は胎児がだんだん大きくなるにつれて、母親の体は重...

牛乳豆腐の食べ方

牛乳豆腐といえば、漢族の友人の多くはそれがどんな食べ物なのか知らないかもしれません。実はそれは私の国...

世界COPDデー |妨げられることなく自由に呼吸できる

著者: ニー・シャン、首都医科大学北京友誼病院呼吸器科副主任医師イラスト: 首都医科大学北京友誼病院...

感謝祭におすすめのヘルシーな食べ物、覚えておくべき5つの重要な要素!

感謝祭は、アメリカとカナダで共通の祝日です。もともとアメリカで、インディアンに感謝するという本来の意...

豆腐と白菜:長生きするための10種類の食べ物

寿命を延ばすために何を食べたらよいでしょうか? キビ、バナナ、ニンジン、イチゴなど、10 種類の一般...

データの汚染:アーティストは AI に対してどのように反撃しているのか?

シカゴ大学は最近、「Night Sunflower」と呼ばれるデータ汚染ツールを開発した。これは、画...

蓮の実八宝粥の作り方

蓮の実や八宝粥は缶詰で食べる人が多く、自分で作ったことがないという人が多いです。実は、私たちの日常生...

科学的な観点から見ると、人間は最長何歳まで生きられるのでしょうか?

2021年12月16日は、世界最高齢の一人であるアリミハン氏がこの日に笑顔で亡くなったという異例の...