GPT-4 はどれくらいクリエイティブなのでしょうか?知的生物特有の発散的思考が人間を超えた!

GPT-4 はどれくらいクリエイティブなのでしょうか?知的生物特有の発散的思考が人間を超えた!

発散的思考は、創造的思考の中心的な指標であり、人間の創造性の具体化であると考えられています。

ChatGPT-4のような大規模モデルが人間を超える発散思考を持っているとしたら、知的生物にのみ属するこの独自性が人工知能(AI)によっても学習されているということでしょうか?

最近、アーカンソー大学の研究チームは、ChatGPT-4の創造的思考テストにおけるパフォーマンスが人間を上回ったことを研究で発見しました。

「人工知能生成言語モデルの現状は、発散的思考タスクにおいて人間よりも創造的である」と題された関連研究論文が、ネイチャーの関連誌であるサイエンティフィック・リポーツに掲載された。

研究チームは、「全体的に、GPT-4は、応答の流暢さを制御した場合でも、あらゆる発散的思考タスクにおいて人間よりも独創的で複雑です。言い換えれば、GPT-4は発散的思考タスク全体でより高い創造的可能性を示しています。」と述べています。

GPT-4 の発散思考は本当に人間よりも優れているのでしょうか?

論文によると、研究チームは151人の被験者とChatGPT-4のパフォーマンスを、代替用途タスク、結果タスク、および発散的関連タスクという3つの創造的思考タスクでテストした。

これらのタスクは、日常の物の創造的な使用、仮想的な状況の考えられる結果、単語間の意味の違いの理解など、個人の創造的思考能力を評価するように設計されています。これらの基準は、創造的思考課題における各参加者のパフォーマンスを定量化するのに役立ち、その後の分析の基礎も提供しました。

代替用途タスク: これは、参加者に共通のオブジェクトについてできるだけ多くの異なる用途を考え出すように求める古典的な創造性テストです。たとえば、参加者は一枚の紙の複数の用途を考え出すように求められる場合があります。このタスクは、ユニークで多様なアイデアを生み出す個人の能力を測定するために設計されています。

結果タスク: このタスクでは、参加者は異常な状況や出来事を想像し、起こり得る結果を説明するよう求められます。たとえば、重力が突然消えてしまったらどうなるでしょうか?この課題では、論理的推論と想像力における個人の創造性を検査します。

発散的連想タスク: このタスクでは、参加者は与えられた刺激語 (「クラウド」など) に対して、できるだけ多くの関連する単語やアイデアを提供する必要があります。このタスクは、個人の精神的柔軟性と語彙連想能力を評価するために使用されます。

テスト結果では、ChatGPT-4 が 3 つの創造的思考タスクで人間の参加者よりも大幅に優れた成績を収めたことが示されました。生成された応答の数、応答の長さ、意味の違いのいずれの点でも、ChatGPT-4 は大きな利点を示し、創造的思考の分野におけるその可能性を浮き彫りにしています。

図 |代替用途タスクでは、GPT-4 は、特定のプロンプトに対してのみ、同じ数の回答生成機会を与えられた場合、人間よりも異なる回答を導き出すことに成功し、高い独創性を示します。 (出典:本論文)

図 |結果タスクでは、GPT-4 は人間と比較して、同じ数の機会を与えられた場合、より多くの異なる応答をよりうまく見つけることができ、プロンプトの種類に応じて高い独創性も示しました。 (出典:本論文)

他の要因の影響を排除するために、この研究では応答流暢性に関する対照比較も実施しました。結果は、応答の流暢さが制御された場合でも、ChatGPT-4 は依然として高い創造的潜在能力を示し、創造的思考タスクにおけるその優位性をさらに裏付けていることを示しました。

この調査結果は、創造的な可能性と実用的な応用についての議論を引き起こしました。 ChatGPT-4は創造的思考タスクにおいて大きな利点を示したものの、研究チームはその適用性の限界も指摘した

たとえば、人間と比較すると、ChatGPT-4 には自律性と現実世界での経験が欠けており、その創造的な可能性は人間のユーザーからのガイダンスと入力に依存しています。したがって、ChatGPT-4 は創造的なアイデアを生み出す能力がありますが、その実用的な応用はまだ限られています。

さらに、ChatGPT-4 の創造的可能性を評価する際には、その応答の適用性と実用性も考慮する必要があります。 ChatGPT-4 は多数の独創的なアイデアを生成できますが、これらのアイデアが実際の状況に適用可能であり、有意義な結果を生み出すことができるかどうかについては、さらなる研究と検証が必要です。

最後に、研究チームは人間の創造性の独自性と多様性も強調しました。 ChatGPT-4と比較すると、人間はより幅広い経験と感情を持ち、より柔軟かつ多様な方法で考え、創造することができます。したがって、創造的な可能性を探る際には、ChatGPT-4 のパフォーマンスを人間のパフォーマンスと単純に比較するのではなく、実際のアプリケーションにおけるその適用性と限界をより包括的に考慮する必要があります。

AIは人間に取って代わるでしょうか?まだ分​​からない

これまでの研究と比較して、本研究のテスト結果は、ChatGPT-4が複数の創造的思考タスクにおいて大きな利点を持つことが明らかになり、創造的思考における人工知能に関する新たな洞察をもたらしました。

しかし、これにより、さらなる疑問が生じ、今後の探究の方向性も決まります。人工知能と人間の創造的思考の関係について徹底的な研究を行い、イノベーションを促進するために人工知能をより有効に活用する方法を探る必要があります。

今後の研究では、創造的思考のさまざまな側面をよりよく理解し評価するための、よりスマートで包括的な尺度の開発を目指します。人工知能技術が発展し続けるにつれて、人間の創造性に対する理解は深まり続け、より創造的で知的な未来を築くための強固な基盤が築かれます。

これらのテストが人間の創造力の潜在能力を完璧に測るものであるかどうかは重要ではないと研究チームは主張している。重要なのは、ビッグモデルが急速に進化し、前例のない方法で人間を上回っているということであり、それが人間の創造性に取って代わる可能性があるかどうかはまだ分からない。

また、将来的には、人工知能はインスピレーションを得るためのツールとして、個人の創造プロセスの補助ツールとして、あるいは固定観念を克服するためのツールとして大きな可能性を秘めているだろうとも述べた。

参考リンク:

https://www.nature.com/articles/s41598-024-53303-w

https://arkansasresearch.uark.edu/ai-outperforms-humans-in-standardized-tests-of-creative-potential/

<<:  小中学生のための全国安全教育の日 |安全を第一に考え、人生の成功への道を歩み始めましょう!

>>:  アリの洞窟の大きさはどれくらいですか?蟻穴にセメントを流し込んだのですが、10トン流し込んでもまだ埋まりませんでした…

推薦する

牡蠣フライの作り方

多くの人が油をかけた牡蠣を食べるのが好きです。この珍味は栄養が独特で、食べても体に何の影響もありませ...

ギャラクシーS6のアルミボディが初公開:金属が人気

Galaxy S6は最近頻繁に露出しています。以前の Galaxy S フラッグシップと比較した最大...

利芳制度は人々の「扉を開ける自由」に影響を与えたのか?長安から見た中国古代都市計画

1つ古代唐の長安から見た「利芳システム」の過去と現在唐代の首都である長安の街路や路地は、非常に整然と...

「食から健康」シリーズ | 「冬には大根を食べ、夏には生姜を食べましょう」とよく言われるのはなぜでしょうか?漢方食事療法の謎を解明

「冬には大根を食べ、夏には生姜を食べる」というのは、中国人がよく言う民間のことわざです。なぜ大根と生...

生姜キャンディーを食べるとどんな効果があるのか

生姜は私たちにとって調味料というイメージがあります。辛くて刺激的な味の生姜は、料理の脂っこさを効果的...

エストロゲンを含む食品

エストロゲンは女性ホルモンです。女性の友人にとってとても重要です。女性の友人がエストロゲンを欠くと、...

最近調べるのを忘れないでください!この命がけの旅はこれから始まる

私はバードウォッチングの愛好家です。しかし、仕事が忙しくて郊外に野鳥観察に行く時間が取れないときもあ...

なぜ50歳を過ぎると体中に痛みを感じる人が多いのでしょうか?医師はその理由を説明した

50歳を過ぎると、多くの女性が体中に痛みを感じます。頭痛は頭を治療することで、足の痛みは足を治療する...

キングオイスターマッシュルームのレシピ - アワビソース添えキングオイスターマッシュルーム

エリンギは近年栽培された新しい品種で、美味しいだけでなく、血中脂質やコレステロールを下げる効果も非常...

屋外での運動が近視の進行を遅らせるのに役立つのはなぜですか?

最近では、子供を屋外で頻繁に運動させることが近視の予防や抑制に良いとよく聞きます。これはなぜでしょう...

ザリガニの効能と機能

私たちの友人の多くはザリガニを食べたことがありますが、ザリガニには実は「ザリガニ」という別の名前があ...

ハイパーループのキャビンデザインコンペがスタート、マスク氏のクレイジーな夢が一歩近づく

今週末、20チームがロサンゼルス郊外に集まり、最高のハイパーループポッドデザインの称号を競いました。...

人体科学 |女の子の胸はなぜ柔らかくなったり硬くなったりするのでしょうか?

「Body Code Decoding Bureau」(公開アカウント:stmm163)をフォロー...

ビール瓶のキャップにはなぜ21本の歯があるのでしょうか?

レビュー専門家:羅慧謙、中国科学院物理研究所研究員、ポピュラーサイエンスライター夏はもちろん、ビール...

ティックスマートウォッチ初テスト

プロセッサからオペレーティングシステム、全体的な設計開発まで、完全に国有の独立した知的財産権を持つT...