2017年、AIは人間が設計したすべてのゲームで人間に勝利した

2017年、AIは人間が設計したすべてのゲームで人間に勝利した

20 世紀の大部分において、チェスは人工知能研究者のベンチマークとしての役割を果たしてきました。 1950 年代初頭、ジョン・マッカーシーは「人工知能」という用語を作り出した。彼はかつてチェスを「人工知能分野におけるショウジョウバエ」と呼んだことがあるが、これはショウジョウバエに関する初期の研究が遺伝学の分野に与えた影響に由来している。

1990 年代後半、IBM の Deep Blue は世界チャンピオンのガルリ・カスパロフと一連のチェスの試合を行った。

1997年、ディープ・ブルーはついにカスパロフを破り、ゲームで機械が世界チャンピオンに勝利した初めての事例となった。世紀の初めから中頃にかけて、技術は進歩し、チェスのほぼすべてのバリエーションにおいて、機械がチェスの名人に一貫して勝つようになりました。

当然のことながら、AI 開発者は、ますます高度化するアルゴリズムをテストするために、他のより複雑なゲームに目を向け始めています。過去 12 か月間で、人工知能は一連の新たな限界を超え、古代の囲碁からダイナミックなインタラクティブ カード ゲームであるテキサス ホールデムまで、さまざまなゲームで人間のプレイヤーに勝つに至りました。

チェスから囲碁まで

1990年代後半、機械がついにチェスのグランドマスターに圧倒的な勝利を収めた後、プリンストン大学の天体物理学者は「コンピューターが囲碁で人間に勝つまでには100年、いやそれ以上かかるかもしれない」とコメントした。

そこでコンピューター科学者たちは、学ぶのは非常に簡単だが習得が難しい中国発祥の戦略ゲームである囲碁に注目した。

過去 10 年間で、機械学習の進歩により、真に競争力のある AI 囲碁プレイヤーが誕生しました。 2014年、GoogleはAlphaGoと呼ばれるディープラーニングニューラルネットワークの開発を開始しました。数年にわたって成功に近づいた後、開発チームは別の方法を試しました。

2016年後半、アジアの人気ゲームサーバーTygemに「Master」という謎のオンライン囲碁プレイヤーが現れた。その後数日間、この謎の選手は多くの世界チャンピオンとの試合で圧倒的な強さを見せた。 2017年1月4日までに、「Master」は実際にはDeepMindのAI AlphaGoの最新バージョンであることが正式に確認されました。

2017年5月、AlphaGo「マスター」は世界トップランクの囲碁プレイヤー、柯潔を破った。 AlphaGoと柯潔が対戦した3局では、機械が常に有利な立場にあったが、最も驚くべきことは、10月にGoogleが「名人」よりも高度なバージョンのAlphaGoを開発したことだ。

Nature誌の記事によると、AlphaGo Zeroは、囲碁のプレイ方法を素早く自己学習できる革新的なアルゴリズムだそうです。システムは何度も自分自身と対戦し、さまざまな状況でどのようにプレイするかを学習します。 21日間の学習を経て、AlphaGo Zeroは「マスター」レベルに到達しました。 40日後、これまでのすべてのバージョンのスキルレベルを超えました。

2017年12月までに、DeepMindはシステムのより高度なバージョンを発表しました。 AlphaZeroと呼ばれる新しいAIは、数時間で複数のゲームをマスターすることができます。 8時間の自己トレーニングの後、このシステムは以前のAlphaGo Zeroに勝っただけでなく、チェスと将棋も完全にマスターすることができました。

ポーカーで不正行為をする技術をマスターする

囲碁ゲームの複雑さはすでに非常に高いのですが、人工知能にとって、囲碁とポーカーはまったく異なる 2 つのモデルを採用しています。ポーカーで勝つには、いくつかの不正行為のスキルを習得する必要があります。不正行為をすることと他人の不正行為を見抜くことは、ポーカーで成功するために習得すべき重要なスキルです。

10年以上の努力を経て、2017年に2つの独立した研究により、人工知能がついにトップクラスのポーカープロに勝利したことが示されました。カナダのアルバータ大学の研究者らは、AI形式の「直感」を使って人間のポーカープレイヤーを出し抜くことができるAIシステム「DeepStack」を発表した。

20日間の過酷なマラソンの後、マシンは4人のプロポーカープレイヤー全員を徹底的に打ち負かした。

カーネギーメロン大学の研究チームは2017年1月、より公開的なイベントを開催し、Libratus AIシステムで20日間かけて4人のプロポーカープレイヤーを相手に12万ラウンドのノーリミットテキサスホールデムをプレイした。プロたちが毎晩 AI のどの弱点を利用できるかを議論する一方で、AI は日々自らを改良し、ゲームプレイの穴を埋め、戦略を洗練させています。

人間の脳は機械に太刀打ちできず、ほぼ1か月間ノンストップでプレイした結果、機械は合計170万ドルを獲得した一方、4人のプロはそれぞれ数千ドルの仮想通貨を失った。プロプレイヤーの一人はワイアード誌にこう語った。「この激しい試合中、私はイカサマ師と対戦しているように感じました。まるで私のカードが相手に見えているような気がしました。イカサマだと非難しているわけではありません。むしろ良いことなのです。」

イーロン・マスクのAI研究

2015年、イーロン・マスク氏と少数の投資家グループがOpenAIというプロジェクトを設立しました。このプロジェクトの目的は、特に強化学習における人工知能システムの開発を探求することです。このタイプのシステムでは、機械は特定のタスクにおける能力を向上させる方法を自ら学習することができます。

2017 年 8 月、OpenAI チームは、「The International」と呼ばれる大規模な e スポーツ トーナメントの中心となるゲームである Dota 2 の制覇を目指しました。 Dota 2 は、競争的なゲームの世界で真剣なスポーツである、非常に人気があり複雑なマルチプレイヤー オンライン バトル ゲームです。

わずか2週間の学習を経て、OpenAIボットはトーナメントに参加し、世界のトッププレイヤー数名を破りました。現在、人工知能システムはより単純な1対1のゲームでのみトレーニングされているが、OpenAIチームはAIが5対5の「チーム」ゲームをマスターできるようにする方法を研究している。

AIが作業を分担して「パックマン」のゲームをプレイ

数年前、Google DeepMind は 49 個の Atari 2600 ゲームで AI をトレーニングしました。人間のプレイヤーと同じ入力が与えられると、AI はこれらのゲームのプレイ方法を理解し、勝つことができます。実際、一部のゲームは他のゲームよりも習得が難しいことが分かっており、これらの古典的で難解なゲームの中でも、1980 年代のビデオ ゲーム「パックマン」は特に難しいゲームです。

2017年、GoogleはMaluubaというディープラーニングのスタートアップを買収し、DeepMindに統合しました。 Maluuba の新しい機械学習アプローチは、ハイブリッド報酬アーキテクチャ (HRA) と呼ばれます。このアプローチをパックマン システムに適用すると、特定の豆を見つけたり、ゴーストを避けたりするなど、それぞれ特定の目標を持つ 150 を超える個別のエージェントが作成されました。

HRA アプローチでは、上級マネージャーに似た上級エージェントが作成されます。この上級エージェントは、各ステップで最終決定を下す前に、下位エージェントからのすべての提案を評価します。このアプローチは婉曲的に「分割統治」と呼ばれ、複雑なタスクをより小さな部分に分割します。

この方法をパックマンに適用したところ、AIは999,990という高得点を出す方法をすぐに習得しました。これは、これまで人間も人工知能も達成したことのないスコアです。

AIがゲームを設計し始める

AI がほぼすべてのゲームで私たちに勝てるなら、次に私たちは何をすべきでしょうか?

ファルマス大学の研究者が最近、私たちに代わってゼロからゲームを作成し、プレイさせることができると主張する機械学習アルゴリズムを発表しました。 「アンジェリーナ」と呼ばれるこの AI システムは、今も日々進化を続けていますが、すでにウィキペディア・コモンズからオンライン新聞、ソーシャルメディアまで、さまざまなソースのデータセットを使用してゲームを作ることができます。

それで、これは何を意味するのでしょうか?

おそらく、2017 年の最大かつ最も恐ろしい出来事は、強化学習システムの大きな進歩でした。これらのプログラムは、新しいスキルを習得する方法を効果的に自己学習できます。たとえば、AlphaZero の最新版は、わずか数日間の自律学習で、いくつかのゲームで超能力を達成できます。

350 人以上の AI 研究者を対象とした大規模な調査では、AI はまだ人間に勝つほど優れていないことが示唆されています。調査では、10年以内にAIが人間よりも優秀になり、2049年までにはベストセラー小説を書けるようになり、2053年までには手術の実施において人間よりも優れていると予測されている。実際、調査では、2060年までにAIが人間と同じことをすべて、しかもより優れた方法でできるようになる可能性が50%あると結論付けられています。

2017 年は、ますます複雑化するゲームで人工知能が人間に勝利した画期的な年であったことは間違いありません。これはささやかな成果のように思えるかもしれませんが、その意味合いは大きいです。これらの AI 開発企業の多くは、現実世界の課題に急速に目を向け始めています。

Google DeepMindはAlphaGo Zeroのシステムを他の分野に応用し、アルツハイマー病やパーキンソン病などの病気の治療法の発見を期待して、タンパク質の折り畳みに関する包括的な研究を行ってきた。

「最終的には、このようなアルゴリズムのブレークスルーを活用して、現実世界のさまざまな問題の緊急課題の解決に貢献したいと考えています」と、ディープマインドの共同創設者兼CEOのデミス・ハサビス氏は語った。 「同様の技術が、タンパク質の折り畳み、エネルギー消費の削減、革新的な新素材の発見など、他の構造上の問題にも応用できれば、達成されるブレークスルーは人類の世界に対する理解を深め、私たちの生活全体に良い影響を与える可能性を秘めている。」

今日頭条の青雲計画と百家曼の百+計画の受賞者、2019年百度デジタル著者オブザイヤー、百家曼テクノロジー分野最人気著者、2019年捜狗テクノロジー文化著者、2021年百家曼季刊影響力のあるクリエイターとして、2013年捜狐最優秀業界メディア人、2015年中国ニューメディア起業家コンテスト北京3位、2015年光芒体験賞、2015年中国ニューメディア起業家コンテスト決勝3位、2018年百度ダイナミック年間有力セレブなど、多数の賞を受賞しています。

<<:  91十条:維来の1台当たりの利益は約7万7500元、シンクタンクはテスラが将来中国から撤退すると見ている

>>:  91十条:ファーウェイはソフトウェアが自動車のライフサイクル全体に深く関与すると述べ、Meizuは自動車の製造を開始する可能性がある

推薦する

低糖質の果物とは?

女性はみんないろいろな果物が好きだと思います。女性にとって果物はおいしいものです。果物はどんな食べ方...

フードブレンダーは栄養吸収を促進しますか?細胞壁を破壊する必要があるかどうかは、成分と人によって異なります。ぜひ見に来てください→

著者: 張宇、中国疾病予防管理センター研究員、医学博士・修士課程学生の指導者査読者:同済大学付属同済...

龍里魚の調理方法

龍里魚も私たちが普段食べている非常に一般的な種類の魚です。この魚も非常に栄養価が高いです。私たちは日...

糖尿病患者はウーロン茶を飲んでもよいですか?

ウーロン茶は多くの人に好まれています。この種類のお茶は人間の消化に非常に役立ちます。ウーロン茶を定期...

なぜザリガニを食べるときにアイスビールを飲む人はいるのに、アイスリキュールを飲む人はいないのでしょうか?

一週間懸命に働いた後、自分にどんなご褒美をあげる予定ですか?鍋料理、バーベキュー、ザリガニはいかがで...

バラクーダの保存方法

私たちは健康管理において、食事に細心の注意を払っています。健康維持のための特別な食事法がありますが、...

チリソースの作り方

毎年、唐辛子が熟す時期になると、唐辛子を食べるのが好きな人は市場に行って唐辛子をたくさん買い、家に持...

炒めインゲン豆の作り方

インゲン豆は、私たちが通常インゲン豆と呼んでいるものです。インゲン豆は誰もが食べたことがあると思いま...

中国乗用車協会:2023年7月自動車小売販売ランキング速報

中国自動車販売協会自動車市場研究部(CPCA)の最新小売販売データによると、国内狭額乗用車市場の7月...

毎日61,000台以上のテレビを販売しているWeijingは、1周年で満足のいく成果を達成したのでしょうか?

この二日間、リオでオリンピック選手たちを応援していたとき、彼らが示した「より高く、より速く、より強く...

「眠っている」種子を優しく目覚めさせる

飼料種子:生態学と畜産の架け橋飼料種子は畜産の重要な基礎です。これらは家畜に豊富な栄養を与えるだけで...

Samsung Galaxy Tab Proのレビュー

Galaxy Tab Proが私たちの目の前に現れ、その8.4インチの画面サイズと7.2mmの本体の...

充電器が詰まった電源タップは「便利」ではなく「危険」です!これを読んだら家に帰って電源を切りたくなるでしょう

編集: ありがとう夫と父の好きなことの一つは、携帯電話、ヘッドフォン、タブレットなど、さまざまな種類...

幸福を「定量化」:AIがドーパミンのコードを解読

コンテンツの概要: ドーパミンは神経系の重要な神経伝達物質であり、運動、記憶、報酬系と密接に関連して...