黄鉄軍 |機械の台頭と無限の知能

黄鉄軍 |機械の台頭と無限の知能

今日は、知性の背後にある原理は何かという問いには答えません。

脳の謎とは何でしょうか?

まず、どのような構造が知性を生み出すのかを見なければなりません。

そして知能を実現する機械を作り、

次に、その起源の謎を研究します。

黄鉄軍氏、北京知源人工知能研究所所長

科学の専門家が科学について語る |北京

みなさん、こんにちは。今日の私のスピーチのタイトルは「機械の台頭、無限の知性」です。

私は「人工知能」よりも「機械知能」という用語を好みます。なぜなら、人工知能は人間が知能を設計していると常に思わせるからですが、実際はそうではありません。知能の担い手として、機械は今後も発展し、進化し続けるでしょう。それが発展するにつれて、知能の継続的な発展が促進されます。

テクノロジーと科学の果てしないフロンティア

知能とは何でしょうか?これは定義するのが難しい非常に基本的な概念です。知能を知覚と認識として定義することもできますが、知能の定義はほぼ無限にあります。

私の知能の定義は次のとおりです。知能とは、システムが情報を取得して処理することで獲得する能力であり、システムを単純なものから複雑なものへと進化させることができます。

私の定義の何が特別なのでしょうか?まず第一に、知能はある特定のシステム上に現れる機能でなければならず、その担い手として物理的なシステムを持たなければならないことを示しています。

第二に、知能とは、システムが情報を取得して処理することによって獲得する能力です。人は食べることでエネルギーを得て体を強くすることができますが、これは運動エネルギーであり、知性ではありません。知能は、本を読んだり、世界を観察したり、耳で情報を得たり、世界と交流したりするなど、情報を獲得することによってのみ発達することができ、それが知能の発達に影響を与える可能性があります。

この定義により、生物学的知能と機械知能を区別することが容易になります。機能的または現象的なレベルでは、それらは似ている場合もあれば、まったく異なる場合もあります。

これらを簡単に区別できる理由は、物理的なキャリアが異なるためです。生物学的知能の担い手は人間を含む有機体である。一方、機械知能の担い手は、コンピューターを含むさまざまな非生物的メカニズムや機械です。

もう一つの違いは、生物学的知能は生命科学の分野に属しているということです。生命科学の研究対象は生命であり、自然科学の一部です。物理学、化学、生物学、天文学、地理学...あらゆる自然科学には、特定の明確な研究対象があります。

生命、特に脳のような複雑な物体は、私たちがこれまでに知っている宇宙の中で最も複雑な客観的物体です。そのため、脳科学、神経科学、認知科学など、生物学的知能に関連する分野を自然科学の最後のフロンティアと呼ぶ人もいます。それを解明できれば、自然科学におけるすべての問題は解決できるでしょう。

対照的に、機械知能は機械によって実行され、機械自体も絶えず進化しています。当初、機械は人間によって設計されました。その後、機械はますます複雑になり、その知能はますます強力になりました。将来的には、機械が自らを設計するようになる可能性があり、機械自体が反復して発展し続けるでしょう。したがって、機械知能の機能はますます増加し、強力になるでしょう。

ではその境界はどこにあるのでしょうか?生物学的知能は常に進化していますが、進化の速度は比較的遅く、限界があります。しかし、将来、機械の進化のスピードは極めて速くなり、その知能は無限であるため、機械知能は科学技術の無限のフロンティアとなります。

ルールの受け入れから自律的な学習へ

完了: 10% ///////////

人工知能について話すとき、人々はそれがコンピューター上でプログラムやアルゴリズムを記述することによって達成される知能であると言いたがるかもしれません。これは実際には機械知能の狭い理解です。それらは機械知能を実現するための単なる手段です。

▲ 狭義の機械知能:コンピュータをベースとした人工知能

この見解によれば、過去 60 年間の機械知能の発展の歴史は、おおまかに 3 つの段階に分けることができます。

最初の段階はおそらく 1950 年代から 1970 年代初頭まででした。当時の基本的な考え方は、機械に論理や推論などのルール(通常はプログラミングやアルゴリズムの作成と呼ばれるもの)を与え、それを機械に実行させるというものでした。

これは確かに知性を達成しています。しかし、人間は設計者であり、機械は単なる実行者であることは明らかです。約 20 年間の発展を経て、この学派は多くの問題が解決できないことを証明しました。

第 2 段階は 1970 年代から 1980 年代にかけてで、エキスパート システムや知識工学などの一連の手法が開発されました。この方法では、ルールを機械に教え込むだけでなく、「北京は中国の首都である」などの知識も機械に教えるべきだと提案している。そのため、当時は多数の知識ベースとエキスパート システムが設計されました。

しかし後になって、そうすることにはまだ問題があることが分かりました。世の中の知識のすべてを本の中の項目や記号に変換できるわけではないので、機械に埋め込まれるコンテンツの多くは言葉では言い表せないものになります。

例を挙げてみましょう。 「赤」という言葉を言うと、皆さんは心の中に明確な感覚を抱くでしょうが、この感覚はいわゆる知識や記号として表現できるものではありません。

3番目の段階は1980年代から現在までであり、「データからの学習」段階と呼ばれます。つまり、人間がルールや知識をまとめ、それを機械に実行させるのではなく、機械やコンピューターがデータから直接ルールやパターンを見つけ出すのです。今は機械学習の時代です。

狭義の人工知能に関しては、大まかにこの3つの段階に分けることができます。

機械はどのようにして知能を獲得するのでしょうか?

完了: 20% ///////////

先ほど述べた狭義の人工知能は、一般的には象徴主義の学派に従う考え方であり、つまり、記号を使用して知能のあらゆる側面を表現し、機械を使用してそれを実行するという考え方です。実際、これらに加えて、非常に重要な学術学校が 2 つあります。 2 番目の学派はコネクショニズムと呼ばれ、ニューラル ネットワークとしても知られています。 3 つ目は行動主義、サイバネティック手法とも呼ばれます。

これら 3 つの流派、あるいは 3 種類の思考の違いを比喩的に理解すると、象徴主義によれば、機械は考えることができるはずです。コネクショニズムによれば、知性を実現するためには脳や神経系などの物理的な担い手が必要であり、そのためには脳を創造しなければならない。行動主義では、脳だけがあって身体がなければ、環境と相互作用できず、知性を形成し発達させることもできないと考えます。

最初の学派である象徴主義は、知能の機能と現象を記号を使って説明するものです。私たちが授業で学ぶ知識の多くは、実際には教師や著者によって象徴的なものに変えられており、私たちはそれを受け入れて学ぶためにそこにいるのです。法則を覚えておいてください、導出の規則を覚えておいてください、大まかに言えば、これが象徴主義です。記号の概念を知能に適用するということは、これらの記号をコンピューターが実行するためのコード、プログラム、アルゴリズムに変換することを意味します。

象徴主義は多くの成果を達成しました。代表的な例を2つ挙げてみましょう。

1つは、人工知能の概念が登場する前に、「Logic Theorist」と呼ばれるソフトウェアアルゴリズムシステムがあり、数学の多くの定理を証明でき、当時非常に有名だったことです。これは、1956 年に AI の概念が出現したときに機能できた唯一の AI システムでもありました。

▲ 著名な数学者であり、中国科学院の院士である呉文軍氏

もう一つの画期的な成果は、中国の科学者である呉文軍氏によって達成されました。彼は 1977 年に Wu 法を提案し、機械で証明できる定理はすべてこの方法で証明できるようになりました。しかし、この文には「機械で証明できる定理」という前提があります。実際、機械では証明できない定理や証明不可能な定理は数多く存在します。

2 番目の学派は行動主義であり、これも人工知能の概念よりも古いものです。

▲ ウォルターの機械仕掛けのカメ @1948

たとえば、1948 年に、ある発明家が上の写真の小さなカメのような機械を発明しました。当時、この機械は光センサーとアナログ回路を使用しており、光センサーで障害物を検知することができました。障害物に遭遇すると、左右に移動して進む道を探します。さらに、神経系の条件反射をシミュレートする回路が内蔵されており、電池が切れそうになったらソケットに戻って充電することができます。

私たちは皆、このことについてよく知っています。今では多くの家庭で使用されています。掃除ロボットです。それは人工知能の歴史よりも長く発明されました。

当時、そのようなマシンにはコンピューターもチップもプログラムもアルゴリズムもありませんでした。内部にアナログ回路が搭載されており、動作や環境との相互作用を通じて知能を獲得します。

近年、ボストン・ダイナミクス社製のロボットなど、非常にクールなロボットをよく見かけるようになりました。非常に複雑な環境でも移動できます。たとえば、上の写真のロボットは高いプラットフォームにジャンプすることができます。

このロボットの設計思想も主に行動主義に基づいています。これらの動作は人間によってプログラムされたものではありません。 「まず左足で踏み出し、次に右足で踏み出し、物体の高さに応じて異なる動作をする」などのルールを設定し、ロボットにそれを実行させています。彼らは訓練を受けています。

訓練がある限り失敗はあるものであり、私たちが目にするものはすべて成功例です。この動きを完成させるために、実は長い時間をかけてトレーニングし、何度も足を骨折したのです。

3 番目の学派はコネクショニズムです。前述のように、知性の実現には物理的な担い手が必要であり、それ自体が客観的な物理的存在です。コネクショニズムの考え方によれば、それはニューラルネットワークであるはずです。

生物や人間の知能の主な担い手は脳を中心とした神経系であるため、機械知能システムを構築する際には人工ニューラルネットワークも構築する必要があります。この人工ニューラル ネットワークの構築は、長い間、さまざまな発明家による実験の対象となってきました。

実際、過去数年間、生物の神経系に関する私たちの理解は依然として非常に限られています。人工ニューラルネットワークを構築するには、生物の神経系から学ぶ必要がありますが、生物の神経系の設計図が得られなければ、さまざまな種類のニューラルネットワークを作成することしかできません。

上の図は、発明された多くのニューラル ネットワーク内のニューロンがさまざまな構造にどのように接続されているかを示しています。

ニューラルネットワークを構築する目的は知能を生み出すことですが、どのようなニューラルネットワークが知能を生み出すことができるのでしょうか?知性を生み出すにはどうすればいいでしょうか?これがコネクショニスト学派が解決を目指す問題となります。

機械は適者生存の法則から逃れられない

完了: 30% ///////////

1980 年代頃、いくつかの研究グループが同様のアイデアを提案しました。これは現在、バックプロパゲーション アルゴリズムと呼ばれています。

▲ 多層ニューラルネットワークにおけるバックプロパゲーションアルゴリズム(1985年頃)

ご覧のとおり、上記のニューラル ネットワークは、実は非常に単純な構造を持つネットワークです。構造が多層構造になっているためシンプルだと言われています。各垂直列はニューロンの層であり、2 つの層間のニューロンは完全に接続されています。つまり、上位層のどのニューロンも下位層のすべてのニューロンと相互接続されています。このようなネットワーク構造は、誰にとっても考えやすく、非常にシンプルです。

生物学的ニューラル ネットワークはこれよりもはるかに複雑ですが、まだ明らかではありません。そのため、現在のところ、人間は自分自身の理解に従ってこのような単純な人工ニューラル ネットワークを設計することしかできません。上記のネットワークは現在でも広く使用されています。

これほど単純な構造がどのようにして知性を生み出すのでしょうか?このネットワークの開始時には、すべてのニューラル接続はランダムです。左側が入力で、右側が出力です。今すぐ顔認識を完了させたい場合、左側に顔画像を入力し、右側にそれが張三か李四かを出力します。このような画像をランダムに入力し、人の名前を出力させる場合、何の学習処理も行わないと、正しく出力することはできません。

たとえば、T1 が 1 のときは張三、T2 が 1 のときは李思であると期待しますが、張三の画像を入力すると、T1 が 1 ではないことがほぼ確実になります。1 でなくても問題ありません。T1 が 1 になることを望んでいるので、T1 と 1 の差はどれくらい大きいでしょうか。この差はΔで表すことができます。 T1 の値を 1 にするために、アルゴリズムはニューラル ネットワークを層ごとに逆に調整し、接続の各前の層の強度値を変更します。したがって、各トレーニングが完了した後には、調整ラウンドを実行する必要があります。トレーニングと調整を繰り返すことで、機械は認識できるようになります。

私はこのようなニューラルネットワークに取り組んできました。簡単な問題でも、3日3晩で練習して、それなりの結果が出せたら良いですね。

したがって、顔を認識する方法に関するルールは存在しません。その機能は、何度も調整を繰り返すことで、ネットワークによって徐々に獲得されます。

これが基本的に、今日のニューラル ネットワーク トレーニングの背後にある考え方です。私たちが最終的に得る結果は、実際には何度も試行を重ね、適者生存の末に達成されたものです。自然が私たちの脳を訓練する方法も、実は同じプロセスです。数十億年にわたる生命の進化の中で、試行錯誤により数え切れないほどの生命が死んできました。

▲ 2006年、ジェフリー・ヒントンはサイエンス誌にディープニューラルネットワークに関する論文を発表した。

2006 年、有名な科学者ジェフリー・ヒントンが改良されたアルゴリズムを提案しました。前述のニューラル ネットワークにいくつかの方法論的改良を加えた後、優れた認識効果を実現できます。私たちはそれをディープラーニングと呼んでいます。

ディープラーニングとは何ですか?深さは、ニューラル ネットワーク内の層の数を指します。今挙げた例には数層しかありませんでしたが、今日のニューラル ネットワークには数百、あるいは数千の層があります。学習は機械学習であり、何度も試行し、パラメータを継続的に調整して、最終的に人間が望む答えに近いものを得ることを意味します。

したがって、ディープラーニングとは、多層ニューラルネットワーク上で繰り返し試行することで規則性を獲得するプロセスです。

これは多くの問題を解決できる普遍的な方法です。顔を入力すると、最終的には張三または李四として認識され、これが顔認識です。文章を入力すると、最終的には単語を一つずつ理解するようになります。これが音声認識です。異なるメディアの他のデータ タイプでも、この方法を使用してデータの背後にある構造を見つけることができます。

複雑な現象の背後にあるパターンや構造を発見する能力は、知性の基本的な特性です。ディープ ネットワークでは、データの種類に関係なく、データ内に構造がある限り、複数回の試行を通じてその構造を見つけることができます。これが基本的にディープラーニングの仕組みです。

機械はどのようにして人間の達人に勝つことができるのでしょうか?

完了: 40% ///////////

ディープラーニングの一例としては、AlphaGo が挙げられます。 2016年、AlphaGo囲碁システムはイ・セドルに勝利した。どうやってそれをやったのですか?大会前、コンピューターが人間に勝つことは不可能だと考え、多くの人がこの可能性を否定していました。なぜなら、彼らの結論の背後にある考え方は、機械にルールを設定することで囲碁をプレイする方法を探すという象徴主義だからです。

▲アルファ碁は視覚認識を通じて「チェスセンス」を獲得

コンピューターは愚かですが、計算は速いです。素早く計算しても問題は解決しません。なぜなら、囲碁にはあまりにも多くの可能性があり、今日のコンピューターが何万年使用しても、すべての動きを見つけるという複雑な計算要件を満たすことは決してできないからです。

しかし、囲碁のあらゆる方法をプレイして、その経験をまとめることは不可能です。では、制限付きチェスゲームのルールを人々はどのように要約するのでしょうか?これは実際に AlphaGo が学習したものです。チェス盤を画像として認識します。

チェス盤は実際にはそれほど大きくなく、361 個の点があり、各点には黒、白、なしの 3 つの状態しかないため、非常に単純な画像であり、人間の顔よりもはるかに単純です。

マシンは大量の画像を見て、一部の画像は勝ちにつながり、一部の画像は負けにつながることが明らかです。したがって、これらの画像をマシンに入力して、「この状況が発生すると勝つ確率が高くなり、そのような画像が表示されると勝つ確率が低くなります」と伝えることができます。勝敗の確率はわずかに異なるだけですが、学べば徐々にルールをマスターすることができます。

したがって、AlphaGo が囲碁をプレイするとき、そのニューラル ネットワークは囲碁の状況を観察し、その中の規則性を見つけることで学習します。このプロセスは、人間が複雑なデータや物事の中にパターンを見つける方法と同じです。

AlphaGo が学習したチェス感覚は、私たち人間が学習したものと同じです。機械が行うことと生物が行うことの間には違いはありません。しかし重要なのは、マシンが強力な計算能力を持ち、より多くのチェスの駒やチェスのゲームを見ることができることです。たとえば、AlphaGo は自分自身と合計 3,000 万回対戦しました。人間が100歳まで生きるとすると、総寿命は36,500日になります。 3,000 万ゲームは、毎日囲碁を約 800 ゲームプレイするのに相当します。

人間は生まれてから100歳になるまで毎日800回のチェスゲームをプレイすることはできませんが、機械なら数か月でそれが可能です。チェスから得られるデータソースは人間が得るものよりもはるかに豊富なので、これまで誰も試したことのない巧妙な動きを数多く見つけ出しました。人間に勝つのは当然の結果です。

▲ 2019年1月、DeepMind AlphaStarは2人のプロプレイヤーを相手に全勝した。​​そのうちの1人は、世界ランキング10位以内のトッププロトスプレイヤーであるManaだった。

チェスをプレイすることに加えて、マシンはゲームをプレイするなど、多くのことができます。 StarCraft のようなゲームでは、勝者と敗者も非常に明確です。

ゲーム全体では多くのシナリオや選択肢がありますが、全体的には非常に明確なルールを持つシナリオです。マシンは役割空間からより有利な戦略を見つけ、その能力を継続的に向上させることもできます。同様の方法を使用して、機械は2019年にトップクラスの人間に勝利しました。

▲2020年6月21日、Qiyuan AI「Star Commander」は、「StarCraft I/II」の全国チャンピオンであるHuang Huiming(TooDming)と、ゴールドファイナルで3回優勝したLi Peinan(Time)を2対0で破りました。

これは2020年6月に北京で開催された大会で、中国のトップスタークラフトプレイヤー2人が機械と対戦しました。このシステム内のマシンが消費する計算能力は、同様の外国システムの 10 分の 1 に過ぎませんが、アルゴリズムの改良により、外国システムに匹敵するレベルに達しています。その日、私はそこにいましたが、ほとんど緊張感なく、2人のトップクラスの人間のマスターを倒しました。

知能機械を作るにはなぜ脳を模倣する必要があるのでしょうか?

完了: 50% ///////////

この観点から見ると、機械知能は非常に急速に発展しており、すでに止められないほどになっているようです。機械はチェスやスタークラフトをプレイでき、さらに複雑な決定を下すことさえできます。この傾向が続けば、機械は人間を超えることができるのでしょうか?大規模な計算能力やビッグデータなどの発展により、モデルはますます大きくなり、人工知能の未来は明るくなるでしょうか?実はそうではありません。

たとえば、顔認識は人工知能の最も成功した応用です。多くの企業の製品は顔認識に重点を置いており、私たちは日常生活の中で顔認識を頻繁に目にしています。では、今日の人工知能システムは顔認識の問題を解決したのでしょうか?

人間の顔を認識する能力には限界があります。平均して、人は合計で約 2,000 種類の顔のカテゴリーを区別することができます。幸いなことに、私たちは生涯でそれほど多くの人を知る必要はなく、2,000人の顔を区別できれば十分です。

たとえば顔認識の場合、写真を入力して、この人物が人口数千万人のこの都市のどこに現れたのかを尋ねます。機械は人間よりも上手くやります。

しかし、一見強力に見える人工知能システムも、基本的なタスクの実行となると、まだ人間には遠く及ばない。

例えば、上の写真の縞模様の服を着ている人物は機械によって検出されましたが、腹部に写真を貼っている人物が人間であることを機械は検出できませんでした。

写真が女性の頭に貼り付けられていなければ、その女性が誰であるかを検出して識別するのは簡単だっただろうが、写真が追加されると、機械は画像の中に人物や顔があることをまったく認識できない。

したがって、機械は非常に強力に見えますが、実際には大きな弱点があり、人間の視覚との間には依然として大きなギャップがあります。

なぜこのようなことが起こるのでしょうか?理由は実はとても単純です。あらゆる知能にはキャリアがあるため、ディープラーニングは人工ニューラル ネットワークに依存し、生物学的知能は生物学的ニューラル ネットワークに依存します。

今日の人工ニューラル ネットワークは、生物学的ニューラル ネットワークに比べるとまだ劣っています。

▲ 人間の視覚システム

この図が示すように、私たちの視覚系は後頭部にあり、目からの信号は視神経繊維を介して後頭部に送られます。この視覚システムは大脳皮質の約 5 分の 1 を占めており、そのニューラル ネットワークの複雑さは、今日のすべての顔認識システムの人工ニューラル ネットワークをはるかに上回っています。したがって、生物学的視覚が強固な物理的基盤と強力な能力を持っていることは驚くべきことではありません。

人間の視覚に匹敵する視覚システムを作りたいのであれば、人間の視覚のニューラル ネットワークに匹敵する人工ニューラル ネットワークを作成する必要があります。

このアイデアは実は新しいものではありません。人工知能の概念が登場する前から、人々はそれについて議論してきました。 2つの例を挙げてみましょう。

▲ フォン・ノイマン

今日話題になっているコンピューターは、フォン・ノイマンがコンピューターのアーキテクチャを定義したため、フォン・ノイマン・コンピューターと呼ばれています。

コンピュータアーキテクチャを提唱した時代にも、彼は独自の視点を提示した。彼は、生物の視覚システムの最も単純で完全なモデルは視覚システムそのものであると信じていました。単純化しようとすると、物事は単純化されるのではなく、より複雑になるだけです。したがって、ある種の知能を実現するためには、その種の知能を実現するための対応する機械や構造が必要になります。

▲ チューリング

チューリングはより有名な学者であり、コンピューターの専門家です。今日のコンピューターの基本モデルはチューリングによって提案されました。チューリングは 1950 年に論文を発表しましたが、これは遡及的に人工知能に関する最初の論文としても認められています。人工知能の概念は 1956 年に登場し、この論文は 1950 年に発表されたからです。

この論文の中で、チューリングは非常に明確な判断を下しました。彼は、真に知的な機械には学習能力がなければならないと信じていました。そのような機械を作るには、まず子供の脳をシミュレートする機械を作り、それを教育し、訓練します。子供の脳をシミュレートできる機械で訓練することによってのみ、期待される知能を生み出すことができます。

なぜ脳模倣なのか?なぜ脳に基づいて行わなければならないのでしょうか?人間もさまざまなニューラルネットワークを作成し、現実世界のいくつかの問題を解決しようと試みることができますが、究極的には、最も経済的な方法は、人間の脳をひょうたんとして使ってひしゃくをコピーし、このひしゃくが機械知能です。

なぜ生物学的脳を「ひょうたん」として使うのでしょうか? 35億年の進化と試行錯誤を経て開発され、その効果が実証された構造だからです。今日私たちがしなければならないことは、この構造を理解し、それを利用して機械知能を開発することだけです。

人間の脳は多くの点で非常に強力です。消費電力はわずか 25 ワットですが、現在のメインフレーム コンピューターよりもはるかに強力な処理を実行できます。地球は既に人間の脳の進化のコストを支払っているので、低コストですぐに使えるリファレンスです。

まず脳を構築し、次に知性の秘密を研究する

完了: 60% ///////////

ここに問題があるかもしれません。多くの専門家はこう言います。「言うのは簡単だけど、実行するのは難しい。脳の仕組みを知っていますか?」

先ほど申し上げたように、脳は人類の自然科学の最後のフロンティアです。脳の謎はいつ解明されるのでしょうか?それは確かに予測不可能であり、数百年かかるのか、それとも数千年かかるのかを言うのは難しいです。

しかし、「機械知能」という4つの単語は、「機械」と「知能」に分けることができます。機械知能に取り組む場合、最初のステップは機械を作ることであり、2 番目のステップは知能を生み出すことです。私たちは知能だけに焦点を当てているのではなく、まず強力な知能を生み出すことができる機械を作る必要があります。まず第一に、私たちは脳の思考や知能のメカニズムを心配するのではなく、機械、脳、そして強力な知能を生み出す構造を気にするべきです。どのようにして知能を生成するのでしょうか?それは後から来たのです。

あまり抽象的にならないために、例を挙げてみましょう。人間は飛行機を作る前にまず飛行の原理を理解しなければならないと信じているなら、人間は今日まで飛ぶことができなかったでしょう。なぜなら、人類はまだ飛行の原理をすべて解明していないからです。

実際、飛行機の発明の歴史的発展過程は次のとおりです。ライト兄弟が1903年に飛行機を発明したとき、飛行の原理はまったく存在しませんでした。 1939 年になってようやく、銭学森とフォン・カルマンが飛行理論を真に確立しました。この30年以上の期間に2度の世界大戦があり、飛行機は非常に重要な役割を果たしました。

それでその間に何が起こったのですか?実際、ライト兄弟は産業時代の技術的進歩を利用し、機械装置を空に飛ばすための力と実験に頼って飛行機を発明しました。ライト兄弟も世界も、なぜ飛行機が飛んだのか理解していませんでしたが、飛行機は飛んだのです。

これを信じることを固く拒否したフォン・カルマンという男がいました。 1908年、彼は他の人々と賭けをした。「人間が巨大な装置を空に飛ばし、しかもそこに人が留まるのは不可能だ。」パリでこの事実を自分の目で見て初めて、彼はなぜこれほど重い装置が空を飛べるのかを研究しようと決心した。飛行の原理を発見し、空気力学を開発するまでに30年以上かかりました。

1939 年以降、空気力学の原理に基づいて、より高性能で、より大型で、より強力な飛行機を製造できるようになりました。しかし、最初の飛行機は原理に基づいて作られたものではなく、人類の大きな発明でした。

科学技術の歴史には、このような出来事が数多くあります。たとえば、コンパスは中国の宋王朝時代に発明されました。当時、私たちは電磁気学について知りませんでしたが、それがコンパスの発明を妨げることはありませんでした。コンパスがなければ、偉大な航海は実現しなかったでしょうし、今日のような技術的進歩があったかどうかも分かりません。

したがって、原則に惑わされず、何かをする前に原則を理解しなければならないと考えてください。これはイノベーションを妨げる大きなイデオロギー的障害です。

知能は実際には同じです。今日は、知能の背後にある原理や脳の謎について答えるつもりはありません。まず、どのような構造が知性を生み出すのかを調べ、次に知性を実現する機械を構築し、その生成の謎を研究しなければなりません。

フォン・カルマンの師匠フォン・カルマンと弟子の千学森の貴重な写真です。フォン・カルマンは晩年、次のように要約した。「科学者は現存する世界を発見し、技術者は未来の世界を創造する。」

科学者が研究する対象は存在していなければなりません。存在しない物体を研究することが形而上学である。エンジニアが作り出すものは科学的原理に基づくものですが、最も優れたエンジニアは原理なしに何かを作ることができる人です。これは0から1への大きな発明です。

発見と発明は同等に重要です。時には発見が発明を導き、時には発明が先に起こり、その後に科学的発見が起こります。機械知能が今やるべきことは、生物学的知能の秘密を発見することではなく、生物学的神経系の構造を発見することです。

では、生物学的知能の背後にあるどのような構造を発見したいのでしょうか?

科学研究で一般的に使用されるモデル動物の種類はわずかです。最も単純な例は、ニューロンが 302 個しかない線虫です。生き残り、繁殖し、知覚し、動くために、わずか 300 個以上のニューロンに依存しています。

線虫よりも少し複雑な生物であるゼブラフィッシュも、現在ではよく使用されています。ゼブラフィッシュは生まれたときには数万個のニューロンしか持っていませんが、成長するにつれてニューロンは数百万個まで増え続けます。ゼブラフィッシュは透明なので、光電子装置を使ってこれらのニューロンの行動を注意深く観察することができます。

もう少し複雑なのはショウジョウバエ、そして哺乳類のマウスです。マウスよりも少し複雑なのがマーモセットで、その脳は霊長類の中で最も小さく、ニューロンの数はおよそ 10 億個です。最も複雑な生物は人間です。人間の脳には約 800 億個のニューロンがあり、その数はほぼ 1,000 億個になります。

生物学的ニューラル ネットワークはそれぞれ複雑さのレベルが異なり、その結果、さまざまなインテリジェントな動作が生まれます。

生物学的脳を分析し、それを機械知能を作成するための設計図として使用できるようになるのはいつでしょうか?これについては人によって意見が異なります。

2016 年 4 月に開催されたグローバル ブレイン プロジェクト ワークショップで提示された見解を引用します。当時、次のように述べられていました。「10 年以内に、ショウジョウバエ、ゼブラフィッシュ、マウス、マーモセットなど、さまざまな動物の脳の分析が完了することが期待されます。」つまり、今後10年ほどで、生物学的脳の解析は霊長類にまで進むことになる。

それで、人類はいつ到着するのでしょうか? 20年ですか? 30年ですか?現時点では答えるのは難しいです。

しかし、一般的には、最先端の技術を使用して複雑なオブジェクトを解析するだけで済みます。技術的な手段で十分かどうかだけで、それができるかどうかに疑問の余地はありません。正確な時間を言うのは困難ですが、それは数十年以内に達成することができます。

テストのコストが最初は非常に高かったのと同じように、今日ではヒト遺伝子をテストするコストは数百ドルしかかからないかもしれません。技術の進歩は、脳構造の分析に大きな進歩をもたらします。

一般的な人工知能に向けて

完了: 70% ///////////

生物学者は生物学的神経系の構造を分析できるため、情報や人工知能に取り組んでいる人々が直面する問題は、電子脳を追跡して構築できるかどうか、つまりインテリジェントマシンを作成できるかどうかです。

実際、この点で世界は急速な進歩を遂げています。 2019年、私の国は、北京のHuairouにある「マルチモーダルのクロススケール生物医学イメージング施設」である主要な国家科学技術施設の建設を開始しました。この施設の主な目標は、脳のニューラルネットワーク構造を分析することです。

Guizhouの高速な天文学的な望遠鏡は、私たちの大きな宇宙を見ていますが、このシステムは私たちの小さな宇宙の生物の宇宙を見ています。

たとえそれが人間の脳ではない場合でも、フルーツフライの脳に数十万のニューロンを生産できると非常に便利です。今日のドローンは強力に見えるかもしれませんが、それらはまだフルーツハエの背後にあります。フルーツフライの脳を構築できれば、対応する電子機器は実際に多くの実際的な問題を満たすことができます。

ドライバーレス車に関しては、数年で成功すると言う人もいますが、他の人は何十年も成功しないかもしれないと言います。ここでの主な問題は、運転脳が環境を敏感に知覚できるかどうかです。

生物学的脳を作成できれば、複雑な空間を知覚するマウスの能力は、今日の無人車よりもはるかに強いでしょう。マウスの脳を作ることができれば、無人運転の機能を完了するだけで十分でしょう。

したがって、これらの脳を高精度でシミュレートしてから、上記の知能を訓練できる場合、人工知能の多くの問題を解決できるようになります。これらの問題の段階的な解決は、一般的な人工知能に向けて歴史的な進歩をもたらします。

今日のすべての人工知能は弱いAIです。弱い人工知能は、狭い人工知能または特別な目的の人工知能とも呼ばれます。このインテリジェントなシステムは、1つのことしか達成できません。何でもできるインテリジェントシステムは、強力な人工知能システムとも呼ばれる一般的な人工知能システムと呼ばれます。

もちろん、人間は強力な人工知能システムです。私たちは1つ以上のことを知っています。私たちが学ぶ限り、問題を解決するさまざまな方法を学ぶことができます。

私たちの将来の目標は、一般的な人工知能システムを作成することです。このシステムを完了することも非常に物議を醸すトピックであり、さまざまな人々が非常に異なる意見を持っています。

2015年1月、AI Safetyと呼ばれる人工知能安全に関する会議がありました。会議に出席する専門家についてオンサイトの調査が行われ、一般的な人工知能または強力な人工知能がいつ登場するかを予測するよう求めました。

彼らの答えを整理します。 10年、20年、30年、50年、それが決して起こらないと言ったと言った人もいます。予測の中間点は2045年です。つまり、この種のインテリジェンスは2015年から30年後に作成されることを意味します。

私はその会議に出席しませんでしたが、私の評価は似ています。

その会議の前に、「Can Humans Create a Super Brain?」というタイトルの記事を公開しました。 "記事。実際、記事の元のタイトルは「スーパーブレインの作成」でしたが、編集者はそれが絶対的すぎるかもしれないと恐れていたので、彼は質問文を使用しました。この記事では、強力な人工知能を生成できる電子脳をどのように構築するかについて説明しています。また、科学的研究を行っているときにもこの種の仕事をしています。

電子アイは人間の目よりも1,000倍速い

完了:80%//////////

私はちょうど脳をクローンするのに数十年かかると言ったので、数年後に私たちは何ができるでしょうか?数年後、私たちは脳の一部、特に目、視覚的な部分でのみ作業することができます。

眼球には複雑なニューラルネットワークがあります。眼球には1億を超える感覚ニューロンがあり、そのうち約600万が細かい視力に責任を負います。これは、何かを見つめたときに使用するニューロンです。黄斑または中心窩と呼ばれます。私たちがシミュレートするのはこの領域です。

この領域をシミュレートするには、そこで何が起こっているのかを把握する必要があるため、各タイプのニューロンの詳細な構造的および機能的分析を行い、コンピューターでモデル化して再現する必要があります。上の写真は、神経節細胞の1つの構造と、シグナル刺激を受けるときに神経衝動を放出するそのプロセスを示しています。

私の研究グループは、ニューロンを1つずつ分析、モデル化、および複製し、多くの場合、博士課程の学生は数年を費やして1つのニューロンを作ります。

人間の目には約60種または70種類のニューロンがあり、そのうち約10種類の中心窩領域で取り組みました。これらのニューロンをそれらの生物学的構造に従って結び付け、光刺激を感じることができるようにすることで、層ごとにニューロン伝播層のプロセスを見ることができます。

上の写真は、ニューロンが画像によって刺激された後、黄色の光、つまり神経パルスを放出し、視覚刺激のプロセスを表すために互いに相互作用することを示しています。

生物学的神経系の詳細を理解することに加えて、生物の機能を再現するために電子システムを作成する必要があるため、チップを設計しました。

このチップは非常に簡素化されています。実際、上記のアニメーションの背後にあるすべての計算は、生物のすべての詳細がTianhe-2で完了したことを示しています。作成したチップは、コア関数の1つのみをシミュレートしました。

そのようなチップが作られた後、この電子的な目が見えるものを見ることができます。実際、それが実行する機能は、人間の目の機能よりも複雑ではありません。それは人間の目の機能の単なるサブセットです。ただし、1つの違いがあります。電子システムです。

生物の神経系は非常に複雑ですが、生き物は遅いシステムです。生きている生物の任意の2つのニューロンの間に伝達できる神経パルスの数は通常、1秒あたり数十個しかなく、100を超えることはできません。ただし、構築する電子ニューロンの間に送信される信号は、はるかに高速になります。

チップの最初のバージョンは、毎秒40,000パルスを達成しました。生物生物の平均が40であると仮定すると、差は1,000倍です。この1,000倍の速度の違いは、この電子的な目が高速運動を見ることができることを意味します。

たとえば、ファンが回転している場合、人間の目はファンの詳細を見ることができません。電動ファンの刃にいくつかの文字を貼り付けると、ファンが回していないときにはっきりと見えますが、ファンが回しているときははっきりと見えません。

なぜ?生物学的眼は遅いシステムであるため、各ニューロンは1秒あたり脳に数個のパルスしか送信できないため、もちろん、1秒あたり数十回回転する電気ファンの高速プロセスを見ることができません。

電子的な目は、人間の目よりも1,000倍高速です。そのため、いわゆる高速は非常に遅いランニングプロセスであるため、この電子的な目はファンが回転するときにすべての詳細を見ることができます。

▲バイオニックアイ高速カメラと認識システム

電子アイが見えることを証明するために、私たちはレーザーを購入し、上の写真の正方形の構造であるデバイスを作成しました。このレーザーは何ができますか?

▲バイオニックアイ高速カメラと認識システム

これは、1000回遅くなったシーンです。実際の信号はリアルタイムで再生され、誰もはっきりと見ることができません。

ファンが回転し始めた後、アルゴリズムはコンピューターで実行されました。任意の文字を選択できます。上記のPKUは、北京大学の略語です。レーザーが「k」などの文字の1つを押してもらいたい場合、Kキーを押した後、レーザーは「k」が貼り付けられているファンブレードの一連のレーザードットを直接ヒットします。

このシステムのコストは実際には非常に低く、それは私たちが設計したカメラとラップトップで構成されています。将来的には、ラップトップはチップになり、超高速を達成できる小さなデバイスシステムになります。これがバイオニクスの利点です。

従来のコンピューターにカメラを追加すると、この高速プロセスは巨大なキャビネットなしでは実行できません。

人間と機械の現象は可能ですか?

完了:90%//////////

私たちはしばしば、機械やロボットが人間のようであると想像します。これは誤解です。たとえば、多くのハリウッド映画は、人間を過大評価する人間のヒーローと戦うロボットのシーンを紹介することがよくあります。

機械の目は、人間の目よりも1,000倍高速で、さらには10,000倍高速です。その機械的な動きは、人間の動きよりも何倍も進んでいます。互いに戦っている機械と人間の現象は起こりません。

マシンに弾丸を与えると、簡単にキャッチできます。それがあなたを撃つ必要はありません。銃を上げる前に、ロボットはたたきだけで地面にたたくことができます。したがって、これは自分の機能とパフォーマンスをマシンに投影する人間ですが、実際にはそうではありません。マシンが発達するにつれて、それらの能力は私たちの能力をはるかに上回ります。

テスラは1896年に次のように述べています。

脳が人工、電子、または光電気の方法で実現された場合、世界は途方もない変化を起こします。将来、このますます強力な知性と人間がどのように共存するかは、特に挑戦的な問題です。

一方では、この超触覚ニューラルネットワークは人間の脳の構造を継承しているため、私たちと互換性があります。それは私たちよりもはるかに速く考えていますが、それは単なる電子脳です。エイリアンと比較して、私たちは少なくともスーパーインテリジェンスと通信する可能性があります。私たちが構築する強力な機械は、ある意味で私たちの子孫、人類の子供たちです。

一方、Superintelligenceは私たちよりも何倍も速く、私たちは単に追いつくことができません。

ムスクは脳コンピューターの界面に取り組んでおり、「人間は機械に追いつくことができないので、生物学的神経系を機械に接続して一緒に改善することはできませんか?」と考えています。これは良いアイデアのように聞こえますが、それは車と馬車の馬車との関係のようなものです。車は馬車よりも10倍速いですが、車は馬車を引くことはできません。それらは単に同期しておらず、一緒に働くことができません。

したがって、人間を上回る機械が現れると、私たちは大きな課題に直面し、共存して発達する方法を考えなければなりません。

もちろん、多くの人々もこの問題について考えています。 2015 AI Safety Conferenceでは、そのような機械が2045年に登場すると予測されていました。2019年に、「General人工知能」の略であるBeneficial AGIと呼ばれる別の会議が開催されました。会議のテーマは、この種の知性が生まれた後、人間と平和的に共存できることを願っています。私もこの会議に出席しました。

2020年、この会議の参加者の1人であるラッセル教授は、彼のまもなく公開される本「The Birth of AI」の前払いを私に与えてくれました。

これは彼が提案した方法の1つにすぎません。この質問は、人間が本当に考えるべき未解決の質問です。おそらく、これは今後数十年の人類にとって最大の課題になるでしょう。誰もが注意を払い、それについて考えることができることを願っています。

ありがとう!

- 終わり -

記事とスピーチは著者の見解のみを表しており、格智倫道フォーラムの立場を表すものではありません。

以前は「Self Gezhi Lundao」として知られていましたが、中国科学アカデミーのコンピューターネットワーク情報センターと中国科学アカデミーの科学通信局が共同組織し、中国科学普及エキスポが主催する中国科学アカデミーによって開始された科学的および文化的フォーラムです。私たちは、国境を越えて優れたアイデアを発信することに力を注ぎ、「物事を探求し、知識を求める」という精神で、科学技術、教育、生活、未来の発展を探求することを目指しています。 Gezhi Lundaoの公式Webサイト:self.org.cn、Wechat Publicアカウント:Selftalks、Weibo:Gezhi Lundao Forumをフォローしてください。

<<:  ウェッブの後、宇宙はこれらの検出アーティファクトを歓迎するだろう

>>:  帳簿、猟犬、猪

推薦する

セロリ入り牛肉炒めの作り方

牛肉とセロリの炒め物は家庭料理です。使用する材料は豚ヒレ肉とセロリです。作り方はとても簡単で、ほんの...

Arm: Armデータセンター市場シェアは2025年末までに50%に拡大すると予想

最近、Armのインフラストラクチャ事業担当シニアバイスプレジデントのMohamed Awad氏は、2...

168億人民元を調達したLeEcoが、なぜ債権回収を求めるサプライヤーと争い続けたのか?

「LeEcoは1日の制限に達しました。良い旧正月をお過ごしください。」楽視が融創科技から160億元...

妊婦はピーチガムを食べてもいいですか?

妊婦は特別なグループであり、彼女たちの食生活は私たちが注目する価値のある話題です。妊婦をしっかりケア...

これらの「外国特産品」は国産品となった

最近、雲南プラスバージョンのアボカドが店頭に並び始めました。雲南省プーアル市孟連産のアボカドは輸入ア...

リンゴガイを野生のカタツムリとして販売していますか?ゴールデンアップルスネイル 1 匹には 6,000 匹の寄生虫が含まれています。

秘密テロ警報!秘密テロ警報!以前、同紙はゴールデンアップルスネイルの産業チェーンを調査し、殻を剥がさ...

アイスコンクの作り方

冷蔵カタツムリはカタツムリの調理法の一つです。食品を様々なスタイルに革新することでのみ、より多くの人...

「塩の知恵」を総括!古代人はどのような方法で塩を作っていたのでしょうか?

塩は人間の食生活に欠かせない調味料であり、「味の王様」として知られています。その重要性は自明です。小...

中国移動が3G基地局を閉鎖:4Gへの強制的な推進か、それとも無力な動きか?

この記事はNetEase Technologyより転載されました。原題:「中国移動が3G基地局を閉鎖...

携帯電話は「メイド・イン・インディア」の大国の夢と「中国工場」のグローバル化を反映している

インド人がもっと努力しなければ、ムンバイは上海に追い抜かれてしまうだろう。ムンバイのGDPは上海の半...

ドライユリの食べ方

乾燥ユリは、乾燥ユリとも呼ばれます。乾燥ユリは、あらゆる年齢層に適した伝統的な漢方薬です。乾燥ユリは...

酸性食品とアルカリ性食品

食べ物には多くの種類があり、自分の必要に応じて食べ物を選ぶことができます。そうすれば、食べるときに健...

秋以降はスイカを食べてはいけない、お腹を壊すから?真実は…

ゴシップ「秋以降はスイカを食べてはいけません。お腹を壊します。」 「秋にスイカを食べると病気になりや...

LeTVはLeTVエコシステムの最大の欠陥を埋めるためにさらに45億人民元を調達する予定

ターミナル事業やその他の事業の急速な発展により、LeTVの資本チェーンが緊密であることは市場では秘密...

ヌガーは栄養価が高いですか?

ヌガーは、特に子供たちを中心に、多くの人が好んで食べるお菓子です。他の類似のキャンディーはより甘いの...