DeepMindの最新研究：AIは人間に勝ち、より優れた経済メカニズムを設計する

「人類が直面している問題の多くは単なる技術的な問題ではなく、人類全体の利益のために社会的、経済的に調整する必要がある。」「AI技術が役に立つためには、人間の価値観から直接学ぶ必要がある。」

— ラファエル・コスター、ディープマインド研究科学者

人工知能（AI）は人類社会を真に知的な時代へと導くことができるのでしょうか？

人工知能産業は60年以上の発展を経て飛躍的な進歩を遂げ、経済や社会のあらゆる側面で広く活用されるようになりましたが、人間の価値観と一致する人工知能システムの構築は未解決の問題として残っています。

現在、英国の人工知能企業DeepMindによる新たな研究は、人工知能業界の専門家にこの課題を解決するための新たなアイデアを提供するかもしれない。

ディープマインドの人工知能システムは、4,000人以上からの学習とコンピューターシミュレーションを通じて、4人プレイのオンライン経済ゲームで公的資金をどのように再配分するかという政策立案を学んだだけでなく、非常に優れたパフォーマンスを発揮し、他の人間のプレイヤーに勝利したと報告されている。

このゲームでは、プレイヤーは寄付金をそのまま受け取るか、集団の利益のために他の人と分けるかを決定します。

「民主的なAIによる人間中心のメカニズム設計」と題された関連研究論文は、権威ある科学誌「ネイチャー・ヒューマン・ビヘイビア」に7月5日にオンラインで掲載された。

（出典：ネイチャー・ヒューマン・ビヘイビア）

英国ヨーク大学のアネット・ツィンマーマン助教授は、「最も人気のある政策を追い求める『選好満足』システムと民主主義を狭義に同一視すること」に警告を発した。

彼女はまた、民主主義とは単に自分たちの好きな政策を最もうまく実施することではなく、国民が平等に関わり合い、互いに議論できるプロセスを作り出すことだとも述べた。

AIが設計した経済の仕組み

AI 研究の究極の目標は、日常的な作業の支援から社会が直面している大きな実存的課題の解決まで、人類に利益をもたらすテクノロジーを構築することです。

現在、機械学習システムはすでにバイオメディカルにおける主要な問題を解決し、人類が環境問題に取り組むのに役立っています。しかし、人間が公正で繁栄した社会を設計するのを支援するための AI の応用は、まだ開発されていません。

経済学とゲーム理論において、メカニズム設計と呼ばれる分野では、望ましい目標を達成するために、インセンティブを与えられた行為者の間で富、情報、権力の流れを最適に制御する方法を研究します。

この研究で、研究チームは、深層強化学習 (RL) エージェントを使用して、インセンティブを与えられた人々の好みを捉える経済メカニズムを設計できることを証明しようとしました。

このゲームでは、プレイヤーはそれぞれ異なる金額からスタートし、共通の資金プールをより良く発展させるためにいくら寄付するかを決定し、最終的に見返りとしていくらか受け取ることになります。これには、金銭的な寄付をそのまま保持するか、潜在的な集団的利益のために他のプレイヤーと共有するかについて繰り返し決定することが含まれます。

研究チームは、富の平等と不平等の状況においてプレイヤー間で資金を分配する再分配メカニズムを設計するために、深層強化学習エージェントを訓練しました。

共有収益は、AI システムによって設計されたものと人間によって設計されたものの 2 つの異なる再分配メカニズムを通じてプレイヤーに返還されます。

図｜ゲームデザイン（出典：Nature Human Behaviour）

人工知能によって策定された政策では、各プレイヤーが拠出した初期資金の額に基づいて公的資金が再分配され、プレイヤー間の富の格差が縮小される。

このポリシーは、「平等主義」アプローチ（各プレイヤーの貢献度に関係なく、お金を均等に分割する）や「自由主義」アプローチ（各プレイヤーが貢献した国庫の割合に基づいてお金を分割する）よりも、人間のプレイヤーから多くの票を獲得しました。

同時に、このポリシーは初期の富の不均衡を是正し、プレイヤーが初期資本の約半分を拠出しないとほとんど何も得られないため、プレイヤーの「フリーライド」を阻止します。

しかし、研究チームは、研究結果が「AI政府」の処方箋を示すものではなく、政策立案に特化したAI駆動型ツールを構築するつもりもないと警告した。

それは信頼できるでしょうか?

この研究結果は、人間が明らかに好むインセンティブに適合した経済ゲームのメカニズムを設計することで、AI システムを民主的な目標を達成するように訓練できることを示唆している。

この研究では、研究チームは人工知能技術を使用して、再分配スキームをゼロから学習しました。このアプローチにより、AI 研究者自身が偏見を持っていたり、より広範な人口を代表していない可能性があったりする AI 研究者が、最適化するドメイン固有の目標を選択する負担から解放されます。

この研究作業では、理論的に挑戦的な問題も含め、いくつかの疑問も生じています。たとえば、価値調整の方法として民主主義の目標を強調するのは良い考えであるかどうかという疑問が生じるかもしれません。 AI システムは、少数派を犠牲にして多数派に力を与えるという他の民主的なアプローチの傾向を受け継いでいる可能性があります。 AI が社会の既存の偏見、差別、不平等を悪化させるような形で導入される可能性があるという差し迫った懸念を考えると、これは特に重要です。

(出典: Pixabay)

もう一つの未解決の問題は、AI システムに設計されたメカニズムを人々が信頼するかどうかだ。審判員の身元が事前にわかっている場合、プレイヤーは AI エージェントよりも人間の審判員を好む可能性があります。しかし、タスクが人間にとって複雑すぎると人々が考える場合、AI システムを信頼することを選択する傾向があります。

さらに、メカニズムを経験を通じて学ぶのではなく、口頭で説明された場合、プレイヤーの反応は異なるでしょうか?膨大な文献から、メカニズムが「経験的」ではなく「記述的」である場合、特にリスクの高い選択に関しては、人々は異なる行動をとることがあることがわかっています。しかし、AI によって設計されたメカニズムは必ずしも言葉で表現できるとは限らず、その場合、観察される動作は研究チームが採用した説明の選択に完全に依存している可能性が高いと思われます。

研究チームは論文の最後で、この研究結果が、人間の介入なしに自律エージェントが政策決定を行う、ある種の「AIガバナンス」を支持するものであるとも強調した。

彼らは、この方法をさらに開発することで、現実世界の問題を真に人間的な方法で解決するのに役立つツールが提供されることを期待しています。

参考リンク:

https://www.nature.com/articles/s41562-022-01383-x

https://www.deepmind.com/publications/human-centred-mechanism-design-with-democratic-ai

https://www.newscientist.com/article/2327107-deepminds-ai-develops-popular-policy-for-distributing-public-money/

<<: 「類は友を呼ぶ」という言葉に科学的根拠が加わりました！

>>: 新石器時代の「流星ハンマー」発見！