機械と人間に共通の価値観を持たせましょう。人間と機械の連携というこの重要な問題は、誤った命題である可能性があります。

機械と人間に共通の価値観を持たせましょう。人間と機械の連携というこの重要な問題は、誤った命題である可能性があります。

機械学習の急速な発展により、人間の間で懸念が高まっています。深く考えなくても、人工知能の働きを人間の目的と一致させること、つまり機械と人間が一貫した価値観を持つようにすることが必要であることにほとんどの人が同意するでしょう。これは現在注目されている研究テーマです - 「アライメント問題」。アライメント問題に関する研究の成否は人類の運命に直接影響を与えると思われます。

この点に関して、アメリカのベストセラー技術作家であるブライアン・クリスチャンは、彼の新著『Human-Machine Alignment』の中で、機械学習の発展の歴史と最先端の研究を簡潔に説明しています。また、多くの科学者と直接対話し、アライメント問題に積極的に取り組む世界初の学者が、いかに苦労してアライメント計画を策定しているかを読者に紹介します。この本は出版後大きな反響を呼んだが、「人間と機械の整合」問題の意味は本当に私たちが一般的に想像している通りなのだろうか。人工知能の哲学について長年研究してきた復旦大学の徐応金教授は、いわゆる「人間と機械の調和」問題は、深く検討すると実際には疑似問題であり、その前提について徹底的な考察と明確化が必要であると考えている。

ヒューマン・マシン・アライメント(湖南科学技術出版社、2023年6月)、ブライアン・クリスチャン著、タン・ルー訳

徐英進(復旦大学哲学学院教授、上海人工知能研究所顧問)著

人間と機械の連携問題の本質は、人工知能製品の動作出力をいかにして人間の期待に応えさせるかということです。ブライアン・クリスチャンの著書『Human-Machine Alignment』(湖南省科学技術出版社、2023年)では、この問題について論じています。この本は詳細かつ読みやすく、西洋の科学技術倫理コミュニティで議論されている人間と機械の連携に関する最先端の問題について、一般読者に多くの有用な情報を提供しています。しかし、この本を注意深く読むと、「公平性」の問題に関する議論が本の中で非常に大きなスペースを占めていることに気がつくでしょう。著者は、人工知能システムの使用によって、人間社会における既存の偏見、特に人種差別や性差別が強化されるのではないかと非常に懸念していることがわかります。

多くの人々は、このような問題を懸念するのは当然だと考えるだろう。なぜなら、人類の普遍的な価値観は明らかに人種差別や同様の偏見に反対しているため、人工知能製品の成果はそのような価値観に「一致」する必要があるからだ。しかし、詳しく調べてみると、この見解に含まれる矛盾がすぐに明らかになります。矛盾の一方は、特定の形態の差別に反対することは普遍的に認められた価値観であるということです。しかし、矛盾のもうひとつの側面は、現在主流となっている機械学習技術によって得られる「バイアス」が、実際にはインターネット上で見つかる大量の実際の人間の出力から来ているということです。言い換えれば、これらの「バイアス」はすでに人間の価値観を反映しています。ここで、新たな疑問が生じます。「価値観の整合」という概念には、特定の価値観(ロールズのリベラルな価値観など)と特定のローカルな価値観(保守的な価値観など)の間の対立が含まれる可能性があるのです。したがって、人間と機械の間のいわゆる価値観の対立は、異なる価値観を持つ人々の間での意見の対立を伴う可能性があります

ここで注目すべきは、英語の「偏見」という言葉自体が軽蔑的な意味を持ち、事実の根拠のない主観的な意見を指すということです。しかし、認知科学の観点から見ると、インテリジェントエージェントは、膨大な時間的プレッシャーと乏しい知能の下で意思決定を行う必要がある場合が多くあります。したがって、将来の状況についてインテリジェントエージェントが下す判断は、主観性と恣意性の疑いを避けるのが難しい場合が多いです。たとえば、ネズミの場合、同族が特定の匂いのする食べ物を食べて死んだとわかれば、その集団全体がその食べ物には触れなくなります。そして、小さなサンプルに基づくこの決定は、明らかに主観的かつ恣意的です。しかし、彼らがそのような食品を摂取して死ぬリスクを負う余裕がないのは明らかであり、したがって、それらを避けることは、生態学的考慮に基づくゲルト・ギゲレンツァーの「合理性の倹約」の基準にぴったり当てはまる。ダーウィンの観点から見ると、人間の脳はネズミの神経系よりもはるかに複雑であるにもかかわらず、それでも「合理的な倹約」の基準に従って動作エネルギーを節約します。たとえば、女性が交際中に眼鏡をかけた男性に騙されたとしたら、彼女は将来必ずそのような男性を避けるでしょう。その判断の背後にある動作ロジックが、実際にはネズミが特定の種類の食物を避けるロジックと何ら変わらないことは容易に理解できます。明らかに、私たちの世界に対する理解は基本的にそのような「偏見」に基づいています。人間の認知コストを節約する上でのこれらの「バイアス」の重要性を考えると、それらすべてを否定的なものとして分類するのは不適切かもしれません。もっと適切な言葉は、ドイツ語の「Vorsichit」から来ているかもしれません。これは「偏見」を意味し、確かに「偏見」よりも中立的な響きの言葉です。

「先入観」に基づくテキスト解釈戦略は、ドイツの哲学者ハンス・ゲオルク・ガダマー(1900-2002)の解釈学に基づいていますが、彼の関連する見解は、現在普及している人間と機械の価値整合理論の哲学的仮定とは異なります。現在の人間と機械の連携の物語モデルによれば、人間の目標は客観的な存在であり、AI システムの目標はその目標に到達することであり、これはプレーヤーの目標がボールをゴールに蹴り込むことであるのと同じです。ガダマーの見解では、テキストを解釈する目的は客観的な存在ではなく、解釈者、テキスト自体、そして現代の環境との相互作用によって形成される「視点の融合」の産物である。つまり、どのようなテキスト解釈の答えが客観的な答えとみなされるかは、具体的な歴史的背景によって異なります。ある瞬間に客観的であるとみなされた答えが、別の瞬間にはもはや客観的ではないとみなされる可能性があります。そのため、通訳者の主観的な要素がジュースのようにカクテルに染み込んでしまい、排除できなくなります。この観点からすると、目的と手段を明確に区別する人間と機械の連携理論の基本的な方法論的前提は疑問視されるかもしれない。

——では、「主体性を尊重する」という名のもとに、人種差別や性差別を容認していいのでしょうか?

このような質問に対するガダマー流の答えは、もちろん人種差別や性差別に反対しなければならないが、それはそれが事前に肯定されるべき価値目標だからではなく、人類の歴史的発展の現段階では、もはや人種差別や性差別を受け入れることができないからである、というものである。言い換えれば、古代ギリシャの歴史的背景を理解するために同情心を持つ必要があるならば、奴隷制に対するアリストテレスの寛容さを理解するためにも同様に同情心を持つ必要がある。これは、時代背景や特定の集団の属性から切り離された抽象的な「人間の価値」が存在しないことを意味します。したがって、この抽象的な「人間の価値」に対する人間と機械の調整操作は存在しません

上記の抽象的な議論の具体的な技術的意義は何でしょうか? 「緊急回避」機能を備えた何らかの人工知能自動運転ソフトウェアを作成する必要があると仮定すると、設計者は「緊急回避」状況が実際に発生したときに車がどのタイプのオブジェクトを保護する必要があるかを考える必要があります(たとえば、左側の歩行者と右側の歩行者のどちらかを選択するなど、いわゆる「トロッコ問題」に似ています)。人間と機械の価値観の整合という主流の理論によれば、そのようなソフトウェアの出力は全人類の道徳的直感と一致している必要があります。しかし、ここに問題があります。おそらく、全人類が普遍的に共有するそのような道徳的直感は存在しないのです。ある文化では子供の保護を優先し、他の文化では女性の保護を優先し、また他の文化では交通法規に違反した者は犠牲にされるべきだと考え、さらに他の文化では特別な宗教的意義を持つ動物(道路を横切る聖なる牛など)を優先します。その中で、どの文化が正しい意見を持っているのでしょうか? 「反差別」を特徴とするリベラル理論はここで行き詰まりに陥っている。緊急時のリスク回避シナリオ自体が、犠牲にする必要のある特定の種類の対象に対する「偏見」を意味するのだ。したがって、すべての偏見を犠牲にする必要があるとすれば、緊急ヘッジ自体を排除する必要があることを意味します。しかし、もしそうであれば、私たちは災害の影響を制御するための努力を一切行わないことになるでしょう。しかし、これ自体はほとんどの人々の価値観と一致しません。したがって、人間と機械の調整の自由な影響により、人間と機械の調整活動自体が不可能になります。このパラドックスを解消する唯一の解決策は、哲学における解釈学に目を向けること、つまり、特定の人工知能システムの動作目標が特定の文化的慣習と相互に関連していることを認識することです。

著者の上記の意見に対する反論の 1 つは、緊急回避は人工知能システムに期待される機能の 1 つにすぎず、この問題で発生した「ターゲットの曖昧な調整」問題は実際には特殊なケースにすぎないというものです。その他の問題については、「人間と機械の連携」の目標が何であるかをまだ明確にすることができます。たとえば、大規模な言語モデルの操作により、現在では一般的に、いわゆる「機械幻覚」問題が生じています。これは、モデルが、非常にリアルに見えるが真実ではない大量の情報をユーザーに提供するという形で現れます (存在しないが、素人を完全に騙すことができる捏造された科学論文など)。実際に、そのような情報が真実であるかどうかについては異文化間の評価基準が存在するため、この文脈では、人間と機械の調整の目標に違いはないはずです。類似の例としては、一部の AI ソフトウェアがゲームのルールを悪意を持って理解することでゲームで高得点を獲得できる (たとえば、戦争ゲームでは、「敵の船を複数回攻撃する」という報酬ルールを「同じ敵の船を複数回攻撃する」と誤解する) が、人間のユーザーは明らかにそのようなマシンが使用されることを望んでいない。したがって、プログラムによるルールの悪意ある誤解を排除することは、明らかに人間と機械の調整作業の不可欠な部分です。これらのシナリオでは、そのような作業の目標の客観性は明らかです。

しかし、解釈学の観点から見ると、そうではないかもしれません。いったい何が「機械幻覚」であり、何が「規則の悪意ある解釈」であるかは、それ自体が特定の歴史的条件の下での解釈の産物であり、純粋に客観的なものではない。例えば、1891年に出版された『新学偽経の研究』の中で、康有為は『古文文献』『左伝』『詩経』などの経典はすべて前漢末期に劉鑫によって偽造されたと信じていました。したがって、それらはすべて「深刻なナンセンス」に属していました。つまり、劉鑫に代表される古文派の儒学者を炭素ベースの大規模言語モデルとみなすと、これらの古典文献自体が「機械幻覚」が起こっていることの明確な証拠となる。しかし、康有為の判断は正しいのだろうか?銭牧などの学者の研究によれば、康有為の古典に対する判断は間違っており、銭牧の見解は現在学界に受け入れられている。これは、情報の真偽の判断自体が特定の学術コミュニティに依存していることを意味します。自然科学の分野にまで広げると、現在私たちが地球中心説が間違っていると信じている理由は、そのように見なければならない客観的な真実の基準があるからではなく、むしろプトレマイオスの天文学体系が長い間放棄されてきたからです。どのような学術的規範や学術的パラダイムが受け入れられ、あるいは放棄される必要があるかは、それ自体が歴史的発展の結果です。

ルールの悪意ある解釈の事例を見てみましょう。実際、どのような解釈が悪意のあるものであるかは、それ自体が社会通念の産物です。軍事ゲームでは、ポイントを獲得するために目標の船を繰り返し攻撃することは不正行為とみなされますが、サッカーゲームでは、ポイントを獲得するためにゴールを繰り返し攻撃することは正常とみなされます。どのようなルールの解釈が合理的であるかは、ゲームデザイナーの目的と、地域文化のさまざまな微妙な影響によって異なります。つまり、「悪意」を判断する普遍的な基準は存在しないのです。

上記の私の議論は、2つの結論を導き出そうとするものです。まず、人間と機械の整合の問題は、「特定の人間文化と機械の整合の問題」として書き直す必要があります。なぜなら、歴史的および地域的特殊性から切り離された「人間の価値」は存在しないからです。第二に、機械が従わなければならない人間の価値基準の統一性を強制することにこだわると、特定の価値が他の価値よりも抑圧されることになるだけです。これは人類の文化発展の多様性と持続可能性にとって良いニュースではありません。この観点からすると、英語圏における主流の人間と機械の連携の物語は、その前提を明確にするために、徹底した哲学的考察を必要とします。

この記事は科学普及中国星空プロジェクトの支援を受けています

制作:中国科学技術協会科学普及部

制作:中国科学技術出版有限公司、北京中科星河文化メディア有限公司

特別なヒント

1. 「Fanpu」WeChatパブリックアカウントのメニューの下部にある「特集コラム」に移動して、さまざまなトピックに関する人気の科学記事シリーズを読んでください。

2. 「Fanpu」では月別に記事を検索する機能を提供しています。公式アカウントをフォローし、「1903」などの4桁の年+月を返信すると、2019年3月の記事インデックスなどが表示されます。

著作権に関する声明: 個人がこの記事を転送することは歓迎しますが、いかなる形式のメディアや組織も許可なくこの記事を転載または抜粋することは許可されていません。転載許可については、「Fanpu」WeChatパブリックアカウントの舞台裏までお問い合わせください。

<<:  ご飯を炊くときに少し変えるだけで、血中脂質や血糖値を安定させることができます!困っている人に転送してください!

>>:  「一晩置いた食品」とは、一晩置いておいた食品を意味しますか?不明です!これら2つの食品は一晩放置しない方が良いです→

推薦する

麺の作り方

麺は北部の人々にとって欠かせない食べ物です。一日三食麺を食べることもあります。しかし、社会の発展とと...

黒豆ソースで蒸し魚を作る方法

青い波の下、ゴボゴボと音を立てる水の中で、おいしい珍味が醸造されています。水があるところには、いつも...

黄色いゼリーの作り方

人々が普段食べているゼリーは白いものであることは誰もが知っています。栄昌地区には、黄ゼリーと呼ばれる...

軽度の場合は下痢を引き起こし、最悪の場合は死に至ることもあります...緊急警告:食べないでください!

最近、浙江省台州市三門県市場監督管理局は三門県公安局と共同で、巻き貝の違法販売に関する重大な事例を数...

科学者は植物が実際に「話す」ことができることを発見しましたか?

ポプラの葉は風が吹くとカサカサと音を立て、熟した豆のさやは振るとカサカサと音を立てますが、植物自体が...

玉ねぎと黒キノコの炒め物の作り方

タマネギと黒キクラゲは私たちの日常生活でよく使われる食材です。タマネギの味は私たちにとってより適して...

サムスンがWPプログラムの提供を中止したことで1%の悲しみ

Windows Phone が発売されてから数年経ちますが、その市場シェアはどんどん低下し、主流のユ...

自分自身を「誤って判断」するのはどれほど簡単なことでしょうか?

© ニューロフィードバックリヴァイアサンプレス:多くの人が聞いたことがあるであろう格言があります。...

中国のVCはなぜチップに投資しないのか?投資家:利益は石鹸を売るのとほぼ同じ

「なぜ中国のベンチャーキャピタルはチップに投資しないのか?」これは最近投資家に最もよく聞かれる質問で...

ホタルはどうやって光るのでしょうか?事前に請求されましたか?

制作:中国科学普及協会著者: Chongyan Chongyu チームプロデューサー: 中国科学博覧...

Baidu TV製品は市場参入と流通チャネルの確保のため2回連続で発売された。

8月19日、百度は「百度テレビアシスタント1.0」をリリースした。モバイルアプリケーションとして、...

ゴールデンニードルビーフの調理方法

牛肉といえば、多くの友人が真っ先に思い浮かべるのは火鍋です。確かに、火鍋の牛肉の味はとても良いですし...

サーモンスープのレシピ

サーモンは世界で最も美味しい魚の一つであり、多くの人が好んで食べます。サーモンを調理する方法はたくさ...

妊娠初期の栄養レシピ

妊婦にとって、体内の胎児の健全な発育に気を配ることは非常に重要です。特に妊娠初期の栄養補給は胎児の栄...

魚のスープの作り方

雲南省には、麗江の豚バラ肉や鮭、西双版納のパイナップルライス、大理のグリルチーズなど、地元の名物料理...