制作:中国科学普及協会 著者: 王 陳 (中国科学院コンピューティング技術研究所博士課程候補者) プロデューサー: 中国科学博覧会 編集者注:中国科学普及の最先端技術プロジェクトは、インテリジェント技術の最新動向を紹介するために、「人工知能」に関する一連の記事を立ち上げ、人工知能の最先端の進歩を垣間見ることができ、さまざまな懸念や好奇心に応えています。一緒に探究し、インテリジェントな時代を受け入れていきましょう。 最近、DeepSeekはAI分野の「新たなトップスター」として、その強力な機能でソーシャルメディア上で白熱した議論を巻き起こしています。これを未来の生産性向上ツールだと言う人もいれば、これが生活にどのような変化をもたらすのか興味を持つ人もいれば、仕事を奪われるのではないかと心配する人もいます... この待望のスマートヘルパーについて皆様にもっと知っていただくために、中国科学院コンピューティング技術研究所の博士課程の学生である王チェン氏を招き、DeepSeek の中核原理、使用スキル、将来の動向に関する質問に 10 の質問で包括的に回答してもらいました。 AI 初心者でもテクノロジーの専門家でも、この記事を読めば疑問が解決します。この「スマートヘルパー」が私たちの生活の真のパートナーになれるかどうか見てみましょう! DeepSeekは春節期間中に世界的な注目を集めました。現在、多くのプラットフォームが DeepSeek ビッグ モデルに接続していると述べています。それは一体何ですか? DeepSeek は杭州に拠点を置く人工知能のスタートアップ企業です。 2023年7月にHuanfang Quantitativeの共同創設者であるLiang Wenfengによって設立され、大規模言語モデルの研究開発に重点を置いています。 春節前に、DeepSeek は同じ名前の 2 つのオープンソースの大規模言語モデル、DeepSeek-V3 (2024 年 12 月 26 日) と DeepSeek-R1 (2025 年 1 月 20 日) をリリースしました。そのパフォーマンスは、OpenAI のクローズドソース モデル GPT-4o や o1 などの他の大規模言語モデルに匹敵し、コストは他のモデルよりも大幅に低くなります。 DeepSeek-V3 モデルは、ユーザーのニーズに迅速に対応し、自然言語処理、質問応答翻訳、コンテンツ生成などの日常的なタスクのニーズを満たす、費用対効果の高いサービスを提供するように設計されています。 DeepSeek-R1 モデルは、特に数学の問題、コード生成、論理的推論などの分野における複雑な推論タスクに重点を置いていますが、応答時間も比較的長くなります。 DeepSeek がこれほど注目を集めているのはなぜでしょうか? DeepSeek-V3とDeepSeek-R1は春節前にリリースされ、OpenAIが主導するトップクラスの大規模モデルに匹敵するパフォーマンスと、トレーニングおよび推論コストの低さで、すぐに世界中で注目を集めました。 DeepSeek の高いコスト効率は、大手アメリカモデルの独占に挑戦します。このサービスの開始により、より多くの企業やユーザーが、より低価格で最先端の AI 成果を体験できるようになります。 DeepSeek は技術的な詳細とモデルの重みをオープンソース化し、その結果をより多くの人がイノベーションや研究開発に活用できるようにしています。同時に、DeepSeek はオンライン サービスも無料で公開し、多数のユーザー体験を集め、前例のないブームを生み出しました。 DeepSeek-R1 の正式リリースから 7 日後、DeepSeek は ChatGPT を上回り、AppStore の無料アプリダウンロードランキングでトップになりました。 DeepSeek の成功は、中国にとって AI 分野における大きな進歩であり、世界の AI 技術競争における中国の地位を強化するものです。現在、多くの企業や大学が独自に DeepSeek モデルを導入し始めており、その幅広い応用可能性がさらに証明されています。 なぜ、これほど低コストで、これほど限定されたアルゴリズムで、これほど強力な機能を実現できるのでしょうか?中国語表現にのみ強みがあるのでしょうか、それともあらゆる面で優れた性能を持っているのでしょうか? DeepSeek は、主にモデル アーキテクチャとアルゴリズム レベルにおける長期にわたる継続的な革新により、低いトレーニング コストで強力な機能を実現できます。 具体的には、DeepSeek は、Mixture of Experts Architecture (MoE) や Multi-Head Latent Attention (MLA) などの技術を使用して推論コストを効果的に削減します。同時に、データ蒸留、分散トレーニングの最適化、ハードウェア レベルでの微調整により、DeepSeek はリソース使用率をさらに向上させ、トレーニング コストを削減します。複数の革新的な最適化技術を融合することで、DeepSeek はトレーニングと推論のコストを低く抑えながら強力なパフォーマンスを提供できます。 DeepSeek は中国語の理解と応用において優れたパフォーマンスを発揮します。古代中国語を理解して詩を作ることができるだけでなく、インターネットで流行っている用語も正確に把握できます。それに比べて、ChatGPT の中国語は文法的には流暢ですが、かなり堅苦しい感じがします。ただし、DeepSeek の強力な機能は中国語表現に限定されません。数々の公式標準評価において、DeepSeek は英語、百科事典の知識、長文、コード、数学的能力などの分野でトップレベルに達しています。 さまざまな分野におけるDeepSeekのパフォーマンス (画像出典:参考資料2) AI分野では中国語を使うと効率が上がるのでしょうか? AI の分野では、「効率」の向上は、多くの場合、処理の高速化、理解の精度の向上、生成されるコンテンツの品質の向上を意味します。 まず、中国語と英語では構造に多くの違いがあります。中国語は表意文字言語であり、1 つの文字で多くの意味を表現できます。一方、英語はアルファベット言語であり、各単語は複数の文字で構成されています。英語と比較すると、中国語は表現が簡潔かつ効率的で、情報密度も高いです。同じ意味を表現する場合、中国語の方が内容をより簡潔に伝えられることが多いです。そのため、AIの分野では中国語を使用することで表現効率が向上し、コストを削減することができます。 しかし同時に、中国語の多様な意味と複雑な文法構造も、AI の理解能力に課題をもたらします。たとえば、中国語では「花」は植物と費用の両方を意味する場合があり、AI が文脈を理解するのが難しくなる可能性があります。英語にも同義語や多義性の問題はありますが、その構造はより明確かもしれません。したがって、中国語を処理する場合、AI は意味を正確に理解するために、より多くのコンテキスト情報を必要とします。 さらに、データ量とモデルの設計と最適化も考慮する必要があります。 AI モデルを大量の中国語データでトレーニングすると、中国語のタスクでより良いパフォーマンスを発揮する可能性があります。逆に、データが主に英語や他の言語からのものである場合、AI はこれらの言語を処理するときにより効率的になる可能性があります。一部のモデルは特定の言語専用に設計されている場合があり、その場合、そのモデルは当然その言語でより効率的になります。 中国がAI分野で大きな優位性を持っているかどうかについては、意見の一致はない。将来的には、中国語の潜在的な利点をどのように活用するかが重要な研究方向になるかもしれません。 DeepSeek がユーザーの質問に答えるときに「深い思考プロセス」を発揮できるのはなぜですか? DeepSeek-R1 は Chain of Thought (CoT) テクノロジーを使用しているため、ユーザーの質問に答えるときに深い思考プロセスを発揮できます。思考連鎖技術は人間の思考方法を模倣します。モデルは複雑なタスクを単純なステップに分解し、それを段階的に解決する必要があります。これにより、複雑な推論タスクにおけるモデルの能力が向上します。 OpenAIのOシリーズモデルも思考連鎖技術を採用しているが、OpenAIはモデルの元の思考連鎖をユーザーに公開せず、思考連鎖の概要のみを提供した。 DeepSeek-R1 はオープンソース モデルであるため、思考チェーンを完全にオープンにし、ユーザーが問題を解決する際にモデルの推論プロセス全体を明確に確認できるようにします。 ChatGPT と DeepSeek のそれぞれの特徴は何ですか?これらは AI ビッグモデルの将来の 2 つの開発方向を表しているのでしょうか、それとも統合された形で開発されるのでしょうか? ChatGPT は OpenAI の GPT シリーズのモデルに基づいており、トレーニングには大量の多言語データを使用します。多言語とマルチモーダルをサポートし、言語やドメインをまたいだサービスを提供できます。クローズドソースモデルとして、OpenAI によってユーザーにオンラインで提供されます。 DeepSeek は中国語に最適化されており、トレーニングと推論のコストが低くなります。 DeepSeek は、ユーザーが必要に応じて展開およびカスタマイズできるオープン ソース モデルです。現在、それぞれの技術アーキテクチャと市場での位置付けは異なりますが、技術の発展に伴い、将来的には相互学習と統合の傾向がさらに強まる可能性があります。たとえば、DeepSeek は ChatGPT のマルチモーダル機能から学び、ChatGPT は DeepSeek などの競合他社の課題に対応するためにローカリゼーション サービスを最適化することもできます。 DeepSeek はオープンソース モデルをリリースしました。一般公開後、どのように主導的地位を維持していくべきでしょうか。 DeepSeekの創設者である梁文鋒氏は、現在の生成型人工知能は終わりではなく、将来の目標は汎用人工知能の実現に向かうことだと語った。 AI技術が急速に発展している現在、競合他社を打ち負かすほどの技術的優位性を持つ企業は存在せず、クローズドソースのソフトウェアであっても他社に追い抜かれるのを防ぐことはできません。この課題に対処するために、彼らはチームの成長に価値を組み込み、継続的なイノベーションを通じて先頭に立つことを望んでいます。オープンソース化の決定は、この考慮に基づいています。オープンソースは、技術的な独占を打ち破り、技術的な敷居を下げ、より広範な技術協力と革新を促進することができます。オープンソースは、より多くの開発者の参加と貢献を促し、オープンで多様な技術開発環境を構築することができます。 DeepSeekは、このようにして長期的な技術開発を推進し、主導的地位を維持し、AI技術のリーダーになることを望んでいます。 使い方ページを開くと、「Deep Thinking(R1)」と「オンライン検索」のオプションがあります。使用上の両者の違いは何ですか?この大規模な推論モデルをより有効に活用するにはどうすればよいでしょうか? Deep Thinking (R1) オプションをオンにすると、背景が DeepSeek-R1 モデルに切り替わり、数学やプログラミングの問題など、複雑な推論を必要とするシナリオに重点が置かれます。詳細な思考プロセスを示し、推論の手順と最終結果を提供します。 オンライン検索オプションを使用すると、モデルはリアルタイムのインターネット検索結果を取得できます。最新情報を必要とする、時間的に敏感な質問に適しています。モデルは、検索結果に基づいてリアルタイムで更新された回答を提供できます。 Deep Thinking (R1) 機能を使用する場合、ユーザーは質問するときにモデルにさらに考えるように指示する必要がありません。モデルがよりよく理解し、正確な回答を提供できるように、ユーザーは自分のニーズを明確に表現し、あいまいな表現を避けるだけで済みます。深い思考モードでは、モデルの最終的な答えに加えて、ユーザーはモデルによって示された思考プロセスにも注意を払うことができ、問題を解決するための詳細な方法をよりよく把握することができます。 DeepSeek によって最も影響を受ける、あるいは置き換えられる可能性のある業務分野はどれでしょうか? DeepSeek などの大規模言語モデルは、情報検索、データ分析、高い反復性、明確な目標に依存する業界に影響を与える可能性があります。たとえば、コンテンツ作成、データ処理、翻訳校正、手動の顧客サービス、人事管理、財務監査などの分野は、自動化された AI テクノロジーに置き換えられる可能性があります。 AI はユーザーが要求するタスクを効率的に完了できるため、手作業への依存が軽減されます。 しかし、創造性、感情的知性、対人コミュニケーションを必要とする一部の仕事では、人間の関与が依然として不可欠です。 AI技術が急速に発展するにつれ、AIでは簡単には代替できない能力を人間が継続的に向上させる必要があります。これらの機能は、個人が職場で競争力を維持するのに役立ち、将来の職場環境では、人々と AI がより良いコラボレーションと補完性を実現し、共同で社会の進歩を促進できるようになります。 AIはなぜこんなに急速に発展しているのでしょうか?どんどん速くなるのでしょうか? AIはここ数年でいくつかの要因によって急速に発展してきました。 まず、コンピューティング能力の大幅な向上、特に GPU などのハードウェア テクノロジの開発により、AI モデルはより大量のデータを処理し、より複雑なモデルをトレーニングできるようになり、全体的なパフォーマンスが向上しました。 第二に、インターネット技術の急速な発展により、AIトレーニングのための豊富なデータベースが提供されました。同時に、ディープラーニング分野におけるアルゴリズムアーキテクチャのブレークスルーにより、AI 機能も継続的に向上しています。近年、テクノロジー企業や投資家はAIの可能性に注目し、資金と技術の面で強力な支援を行っています。これらの要因が相まって、AI技術の飛躍的な発展が促進されました。 多くの専門家は、AIは今後も急速に進歩し続けると考えていますが、現在のペースを維持できるかどうかはまだ不透明です。楽観主義者は、AI の進歩が指数関数的な爆発を示すだろうと信じています。 AIの知能が成長するにつれて、AIの反復速度はますます速くなり、最終的には人間を完全に超えることになります。しかし、コンピューティング能力とデータがボトルネックとなり、AI 技術の発展が制限される可能性があります。大規模モデルのトレーニングにはますます多くの計算能力が必要となり、現在のところ計算能力の開発は AI トレーニングのニーズを完全に満たすには不十分です。同時に、人類の既存のデータは今後数年で枯渇する可能性があります。 AI技術が計算能力とデータのボトルネックを打破し、今後も急速に発展し続けるためには、世界中の科学研究者の共同の努力が依然として必要です。さらに、AIが引き起こす可能性のある倫理的、法的、社会的問題も徐々に人々の懸念を呼び起こしています。一部の科学者は、より強力な AI システムの安全性と制御可能性を人々が確保できるようになるまで、その開発を一時停止すべきだと呼びかけている。 参考文献: 1.https://en.wikipedia.org/wiki/DeepSeek 2.https://api-docs.deepseek.com/zh-cn/news/news1226 3.https://api-docs.deepseek.com/zh-cn/news/news250120 4. Liu, A.、Feng, B.、Xue, B.、Wang, B.、Wu, B.、Lu, C.、... & Piao, Y. (2024)。 Deepseek-v3 技術レポート。 arXiv プレプリント arXiv:2412.19437。 5. Guo, D.、Yang, D.、Zhang, H.、Song, J.、Zhang, R.、Xu, R.、... & He, Y. (2025)。 Deepseek-r1: 強化学習による LLM の推論能力の促進。 arXiv プレプリント arXiv:2501.12948。 |
<<: 未来の農業におけるブラックテクノロジー: 環境に優しくインテリジェントな肥料は、どのようにして作物に無駄なく栄養を与えることができるのでしょうか?
>>: これらの症状は睡眠不足と関係があるとは思わないかもしれません→
生物多様性の保全野生から都市へ在来種の多様性の保護は在来種を守るための重要な課題です。山水自然保護セ...
01.市場パフォーマンス 01全国オンライン配車サービス市場規模の推移オンライン配車市場の月間アク...
この記事は上海交通大学医学博士のXiaobo Zhou氏によってレビューされました。日常生活で、次の...
誰もが日常生活でスナックを食べるのが好きだと思いますが、不健康な食べ物を食べすぎると老化が早まる可能...
カニ殻黄は実はカニとは何の関係もありません。カニ殻黄は江蘇省常州の特産の軽食です。私たちはこれを小胡...
最近は忙しくて自分でちゃんとした食事を作る時間がなく、一食分だけパスタを作る人が多いです。最近では、...
最近、陝西省の第三古代都市である溧陽城跡では、考古学者は約2,400年前に遡る高床式トイレの遺跡。 ...
海外メディアの報道によると、テスラはモデル3の発売をサポートするために、より多くの自動車サービスセン...
近年、アメリカの報道機関は人工知能技術の発展に歩調を合わせ、ニュースの選択、情報収集、コンテンツ制作...
牛乳は日常生活で栄養価の高い食品の一つです。特に現代人にとって、毎日適度に牛乳を飲むことは健康に良い...
著者:青海省ゴルムド市医薬品管理サービスセンター薬剤師、張成娟 レビュー専門家:青海省ゴルムド市医薬...
居庸関は世界で最も重要な峠として知られています。それが万里の長城の一部であることはご存知かもしれませ...
卵を食べるのが好きな人はたくさんいます。卵はタンパク質が豊富です。卵を長期間食べ続けても、人体に害は...
クミンラムはラム肉の調理法のひとつです。調理法を変えることで、より多くの人がラム肉を食べたいと思うよ...