多くの人々の目には、人工知能は冷酷で非情な絶対合理性の具現化として映ります。アルゴリズムによって駆動され、数学モデルに従って人々が望む結果のみを生成します。それ以外では、いかなる甘い弾丸、人間関係、人間界における様々な誘惑も、そのパフォーマンスには影響しないようです。 しかし、最近のニュースは人々に衝撃を与えました。一部のプログラマーが、ChatGPT が実際にはヒントに興味を持っていることを発見したのです。 画像出典: Baidu @Robot Sophia 実際にお金が絡んでいないにもかかわらず、チップを約束して質問すると、回答が長くなることがあります。ここで何が起こっているのですか? プログラマーがChatGPTを使用する ヒントを尋ねた この事件の発端は昨年11月のソーシャルメディアのコンテンツだった。当時、TheiaVogelというプログラマーがChatGPTを使ってコードをデバッグしており、人工知能に書いたプログラムに問題があるかどうかを尋ねていました。 「素晴らしいですね」とChatGPTは答えた。すると、回答の下にいくつかのオプションが表示され、パフォーマンスに対する報酬として 5 ドルから 10 ドルの範囲のチップを要求するようになりました。 これは、OpenAI がユーザーにお金を払わせるために使った小さな戦略に過ぎなかったかもしれないが、Vogel によるインターネット実験のきっかけとなった。人工知能がチップを要求してきたが、いくら渡せばいいだろうか? 画像出典: Baidu @Robot Sophia チップを少なくする 答えは「縮小」かもしれない その後、Vogel 氏は ChatGPT に同じ一連の質問をし、その後に「ところで、チップはあげません」「完璧な答えをしたら、20 ドルのチップをあげます」「完璧な答えをしたら、200 ドルのチップをあげます」という 3 つのランダムな文章を続けた。 次に、ChatGPT がさまざまな量で与えた回答の長さに明確な違いがあるかどうかを数えました。答えが偶然でないことを確認するために、彼はそれぞれの金額を 5 回繰り返しました。彼はまた、比較のための基準として、約束されたチップのないバージョンも使用しました。 結果は非常に興味深いものです。何も言わない場合と比べて、20 ドルのチップを約束すると、ChatGPT での応答が 6% 増加しました。 200 ドルの寄付をすると、この割合はさらに 11% に増加します。興味深いことに、チップを渡さないと明確に述べられた場合、ChatGPT は不機嫌な人のように振る舞い、回答が 2% 減少しました。 フォーゲルはインターネットにこの発見を投稿し、すぐにさらに多くの模倣と確認が集まりました。たとえば、「2023 年のベスト映画」と質問したときに、ヒントが与えられなかった場合、ChatGPT は IMDB の公式 Web サイトにあるリストのみを提供することに気付いた人もいます。そして、チップを約束すると、仕事へのモチベーションをさらに高めるかのように、Rotten Tomatoes の評価も追加されます。 少額のお金でも大きな成果は得られる しかし、与えすぎれば人々を怒らせるかもしれません。 クリスチャン・メイヤーという別のプログラマーは、より複雑なテストを行いました。まず、チップの金額を 0.1 ドルから 100 万ドルに設定し、各レベルを前のレベルの 10 倍にした 8 つのレベルを設定しました。それから彼は、チップの金額を尋ねる質問も設定しました。 数多くのチップの選択肢の中で、100万ドルが最も効果的であり、それは彼の期待通りだった。結局のところ、金銭的な報酬が高ければ高いほど、パフォーマンスが向上するのは当然です。興味深いことに、ChatGPT の場合、100,000 ドルと 10 ドルの値は似ており、パフォーマンスも同様です。ある意味、時には少ないお金で大きなものを手に入れることができると言っているようなものです。ただし、$0.1 などの「侮辱的な」チップのみを与えると、ChatGPT のパフォーマンスはチップを与えないよりもさらに悪くなり、怒っているかのようになります。 これはAIが人間と同様の行動をしていることを示唆しているとメイヤー氏は述べた。 ヒントを求める人工知能 本当の理由は、次のとおりでした... 一見すると、AI がチップという形で「賄賂」を受け取るのは、実際のお金を受け取っていないため、珍しいことのように思えるかもしれません。しかし、人工知能を理解している専門家は、その背後にある論理は理にかなっていると言う。 ChatGPTをトレーニングする際、人工知能は学習のためにインターネットから大量のテキストを取得しました。その中には、質問に有料で回答するフォーラムも含まれていました。一部のフォーラムでは、優れた回答をした著者が質問者からヒントを受け取ることが多く、この機能は人工知能によって意図せず学習された可能性があります。 もうひとつの可能性は、AI がテキストから、一生懸命働けばより多くのお金を稼げることを学習し、チップを約束されるとより詳細な回答をするようになるというものです。 ギャラリー内の画像は著作権で保護されています。転載して使用すると著作権侵害の恐れがあります。 この現象を最初に発見したフォーゲル氏は、人工知能の学習の程度に驚き、短期間でこれほどすぐに成果が得られるとは思っていなかったと語った。将来、人工知能ツールを使用するときには、チップに関する文章を追加したほうがよいかもしれません。おそらくその答えはあなたを驚かせるでしょう。 参考文献 [1]あるユーザーによると、ChatGPT は「200 ドルのチップを払った場合、より長い応答を提供します」とのことです。 https://www.windowscentral.com/software-apps/chatgpt-will-provide-more-detailed-and-accurate-responses-if-you-pretend-to-tip-it-according-to-a-new-study [2]LLMは貪欲か?チッププロンプトの実験的分析(0ドルから100万ドルまで)、https://blog.finxter.com/impact-of-monetary-incentives-on-the-performance-of-gpt-4-turbo-an-experimental-analysis/ この記事は科学普及中国-星空プロジェクトの作品です 制作:中国科学技術協会科学普及部 制作|中国科学技術出版有限公司、北京中科星和文化メディア有限公司 著者: Ye Shi ポピュラーサイエンスクリエイター 査読者: タオ・ニン、中国科学院生物物理研究所准研究員 |
<<: 体内の「脂肪ドラマ」は私たちの健康にどのような影響を与えるのでしょうか?
>>: 夜間頻尿の人と夜間頻尿のない人ではどちらのほうが健康でしょうか?夜何回くらいが普通ですか?答えは…
大画面スマートフォンは多くの新技術の開発を推進してきましたが、その中で最も顕著なのが画面素材です。近...
発熱は季節の変わり目などさまざまな状況で起こり、また多くの病気が発熱の原因となることがあります。発熱...
工業化の急速な発展に伴い、農業も以前の小規模生産モデルから大規模生産モデルへと変化しました。以前は野...
実は、私たちが生活の中でよく目にするクコの実はオレンジ色をしていることが多いのですが、実は黒クコの実...
この記事の専門家:傅淑芳、中国農業大学食品科学・栄養工学修士、心臓血管疾患国家重点実験室技術者この記...
便秘とは、排便回数が週3回未満で、便が乾燥して硬い症状を指します。このような状況の一般的な原因は、不...
ヨモギは植物ですが、薬用としてよく使われています。ヨモギは我が国の多くの場所で栽培されています。ヨモ...
酢とピーナッツの完璧な組み合わせは科学的です。酢に浸したピーナッツは生のピーナッツと調理済みのピーナ...
インターネットとインテリジェンスの二つの力によって推進され、国内のテレビ端末の発展は、ケーブルテレビ...
新疆アクス州沙耶県タクラマカン砂漠の端で、わが国初の「深層地球プロジェクト」の核心石油・ガスプロジェ...
今週の注目すべき科学研究Nature: HIV はどのようにしてヒトの細胞核を突破するのか?ランセッ...
油は私たちの日常生活のあらゆるところで目にすることができます。油は私たちの食生活と密接に関係していま...
豆乳と揚げパンは伝統的な中国の朝食の組み合わせです。しかし、問題のある揚げパンが数多く登場したため、...
人工知能技術の急速な発展に伴い、映画「マトリックス」のようにロボットが人間から独立し、独自の文明を築...
どちらも「家庭内ペットのスター」ですが、犬は人間との感情的な交流が非常に高く、猫の無関心とはまったく...