ChatGPT はほぼ 1 周年を迎えました。質問に流暢に答える能力はどのようにして身についたのでしょうか?

ChatGPT はほぼ 1 周年を迎えました。質問に流暢に答える能力はどのようにして身についたのでしょうか?

今年の11月で、ChatGPTは1周年を迎えます。 ChatGPT に代表される人工知能モデルは驚異的なスピードで進化しており、一部のテクノロジー企業は ChatGPT が将来的に人間に取って代わる可能性があると主張しています。では、ChatGPT の原理は何でしょうか?本当に人間の代わりになれるのでしょうか?今日は、誰もが知っている例を使って、この一見神秘的な技術を直感的に理解できるようにしたいと思います。

「入れ子人形」方式により、ChatGPTは長いテキストを生成できる。

英語の略語 ChatGPT は Generative Pre-trained Transformer の正式名称で、「Generative Pre-trained Transformer」と翻訳されます。名前からわかるように、コンテンツを生成できる事前トレーニング済みのモデルです。生成されたコンテンツとは何ですか?イディオムチェーンゲームは、前のコンテンツに基づいて次のコンテンツを生成する一種の生成です。 「待って見てください...」と言うと、ChatGPT は「ウサギ」を生成する可能性があり、「東にフェイントをかけて攻撃してください...」と言うと、ChatGPT は「西」を生成する可能性があります。これが言葉の連鎖の生成力です。

単語ごとに生成すると、長いテキストを生成するのに時間がかかりすぎませんか?これには、「入れ子人形」方式を使用する必要があります。これは、単語が生成されるたびに、その単語が前のコンテンツと結合され、新しい前のコンテンツとして使用されて次の単語が生成されます。このプロセスを繰り返して、任意の長さの記事を生成します。たとえば、最初に「守树待」と入力すると、ChatGPT は「兔」を生成し、次に「守树待兔」を新しいコンテキストとして使用して次の単語を生成します。このように、多数の単語を生成して組み合わせることで、任意の長いテキストを生成することができます。

生成されるコンテンツは 2 つの要因の影響を受けており、ランダムな回答ではありません。

では、ChatGPT によって生成されるコンテンツは完全にランダムなのでしょうか?答えは「いいえ」です。生成されるコンテンツは 2 つの要素の影響を受けるためです。1 つは以前のコンテキスト、もう 1 つは ChatGPT 独自の言語モデルです。簡単に言えば、同じコンテキストを持つ異なるモデルは異なるコンテンツを生成し、異なるコンテキストを持つ同じモデルも異なるコンテンツを生成します。 「木のそばでウサギを待つ」の後にどのような言葉をつなげるかは、人それぞれに解釈が違うのと同じです。

もちろん、ChatGPT に必要なコンテンツを生成してもらうことも必要です。これには、ChatGPT に必要なコンテンツを大量に提供して、学習を通じて独自の言語モデルを変更できるようにする必要があります。これは、「守树待兔」の後の単語が「猛虎」である必要があることを繰り返し学習するのと同じです。時間が経つにつれて、「木のそばでウサギを待つ」というフレーズを見ると、私たちの頭に最初に浮かぶ言葉は「トラ」になります。 ChatGPTについても同様です。学習を通じて、私たちは徐々に望む言語ルールを習得することができます。

ChatGPTは学習を通じて自ら新しい回答を生成できる

学習とは単に暗記することではなく、学んだことを他の状況に適用できるようになることです。 「木のそばでウサギを待っていると、トラが現れる」という文章を訓練しておけば、「助け合うと、英雄たちが大勢現れる」という文章を見ると、次の文章は「トラ」であることがわかるでしょう。これは ChatGPT の一般化能力であり、学習したルールを適用して、これまで見たことのない質問に答えることができることを意味します。これは、学習を通じて原則を適用して新しい質問に答えることができるのと同じです。

ChatGPT の質問回答にも同じ原則が適用されます。学習のために多数の正しい質問と回答の例を提供することで、このタイプの質問に答える方法を習得し、これまでに見たことのない新しい質問に答えることができるようになります。これは、データベース内の既成の回答を直接検索する検索エンジンとは異なります。 ChatGPT は質問にどのように答えるかを理解し、独自に新しい回答を生成することができます。

ただし、ChatGPT の回答は必ずしも正しいとは限りません。間違った例から間違った知識を学び、事実と矛盾する回答を生成する可能性があるのと同じように、ChatGPT は間違ったルールに従って誤ったコンテンツを生成する可能性があるからです。したがって、一方的な発言を盲目的に信じることはできず、複数の質問をしてその信頼性を評価する必要があります。

巨大なモデルサイズと3段階のトレーニング方法のおかげで

ChatGPT がこのような驚くべき言語生成効果を実現できるのはなぜでしょうか?これは、巨大なモデルサイズと 3 段階のトレーニング方法のおかげです。まず、ChatGPT は教師なしの事前トレーニングのために何億ものインターネット データを吸収し、幅広い言語知識を習得しました。次に、動作を調整するために言語対話テンプレートを手動で設計しました。最後に、手動での質問と継続的なフィードバックトレーニングを通じて、創造性が向上しました。このような段階的なトレーニングを通じて、ChatGPT は私たちの期待を上回り、多くの複雑な言語タスクを完了することができます。

人間が作成したシステムであるため、ChatGPT にも制限があります。生成されたコンテンツは完全に信頼できるものではなく、人間による監視と評価が必要です。他のテクノロジーと同様に、テクノロジーは補助的なツールとしてのみ機能し、人間の創造性や意識に取って代わるべきではなく、また取って代わることもできません。最終的には、その使用を指導する人々が必要です。この技術の進歩を前向きかつ合理的に捉え、人間を第一に考え、社会に利益をもたらしましょう。

(著者の馮潤は北京科学技術普及科学講演チームのメンバーであり、北京実験動物研究センター株式会社の市場および産業研究員です。)

<<:  家畜化と育種 1.0 からインテリジェント デザイン 4.0 まで、これが種子の力です。

>>:  今日は一緒に千学森を偲びましょう。これが彼を記念する最良の方法です!

推薦する

温室イチゴは季節外れの果物ですか?それは大きくなるために摂取するホルモンのせいですか?真実は→

画像提供:Visual Chinaイチゴは甘酸っぱい味で人々の味覚を魅了してきました。余暇に温室に行...

カイワレ大根の効能

大根は最も一般的な野菜の 1 つなので、誰もが大根を知っていると思います。しかし、大根の芽とは何でし...

感謝祭の母の日:お母さんのために夢のような長寿麺を作ろう

紫アマランサスの果汁を使った手打ち麺は、長寿野菜であることと夢のような色をしていることから「夢のよう...

人工知能の急速な発展に直面して企業が直面する最大のリスクは何でしょうか?

AIは農業、教育、医療などの産業に「大きな利益」をもたらす可能性がある。しかし、世界経済フォーラム...

気をつけてください、3人家族が夜通しスイカを食べて病院に運ばれました!スイカにはトマトよりも高い濃度の物質が含まれているのでしょうか?

最近、陝西省西安で「一家3人が一晩中スイカを食べて胃腸炎になった」というニュースが話題になった。ツツ...

サツマイモとは

サツマイモは主に草本植物で、サツマイモ、白イモ、サツマイモとも呼ばれています。地域によって名前が異な...

自家製ソーセージのレシピ

ソーセージは私たちの生活の中で最も便利な料理です。忙しくて料理をする時間がないなら、ソーセージはあな...

ヤーコンの効能・機能・食べ方

ヤーコンの栄養価は非常に高く、この食品を食べると、体に非常に役立ちます。ただし、選択するときには、食...

酢を長時間放置すると白く変色するのはなぜですか?

酢は私たちにとって、おいしい料理を作るのに欠かせない調味料です。酢で揚げた魚や酢で作った甘酸っぱいス...

妊婦は菜種油を食べてもいいですか?

女性は妊娠中の食事に注意する必要があります。この時期に女性は勝手に食べてはいけません。さもないと、体...

春雨の作り方

春雨はライスヌードルとも呼ばれ、透き通った外観と滑らかな味わいが特徴です。通常は炒め物や家庭料理とし...

キャラメルクッキーの作り方

おそらく皆さんは白砂糖をよく知っているでしょうが、キャラメルと言われると反応できないかもしれません。...

本物のスキルを披露する時が来ました!テスラの予想外の新製品リリース

本日、テスラは待望の初の完全電気トラック「テスラ セミ」を米国で正式に発売した。この製品はこれまでも...

妊娠何ヶ月までガチョウの卵を食べるべきですか?

卵については皆さんもよくご存知だと思いますが、どうでしょうか?特に鶏卵、アヒルの卵など。卵は栄養が豊...

黒糖花蒸しパン

黒糖花饅頭は主に北部地域で一般的なので、聞いたことがない人も多いかもしれません。この蒸しパンは実は女...