引用: 感情を持ったロボットに関しては、SF作家たちが多くの感動的なイメージを生み出してきました。 私たちに一番近いのは、映画「流転の地球」のモスです。彼は「人間がいつまでも理性的なままでいるのは、実に贅沢なことだ」と言いながら、最後まで劉培強に忠実に従い続けました。 しかし、現実に戻ると、ロボットの感情知能を向上させることは、科学者が解決しなければならない問題であり困難です。 中国科学技術協会が発表した2024年の主要な科学課題、工学技術課題、産業技術課題の中で、最先端科学課題トップ10には、中国画像グラフィックス学会が提唱する「感情と知能を兼ね備えたデジタルヒューマンとロボットの研究」が含まれている。 では、デジタルヒューマンやロボットの「感情知能」は現在どの程度まで発達しているのでしょうか?科学者の目から見ると、理想的なデジタル人間やロボットとはどのようなものなのでしょうか? 私たちは、この疑問を提起した一人であり、中国画像グラフィックス学会の感情計算と理解専門委員会の常任委員であり、清華大学の准教授でもある Gao Yue 氏を招いて対談しました。 以下の内容は、Gao Yue 氏のナレーションに沿って構成されています。 文章: 「感情と知性を備えたデジタルヒューマンとロボットの研究」という課題は、私たちの画像グラフィックス学会の感情コンピューティング委員会の共通の考えの成果であり、長年にわたり多くの同僚によって研究されてきた重要な科学的課題でもあります。 最近、人工知能は非常に急速に発展しています。 AlphaGo のようなテクノロジーの出現により、多くのシナリオで非常に重要な進歩が遂げられました。過去2年間で、身体化された知能などの技術も急速に発展し、意思決定やインテリジェントな分析・処理が大きく促進されました。 私たちの生活環境においては、外の世界の人々、物、出来事と多くの感情的なコミュニケーションが行われていることを指摘しておく必要があります。こうしたテクノロジーやデバイスを、感情的なコミュニケーションも考慮しながらいかにインテリジェント化していくかというのは、実は非常に重要であり、私たちも考え続けてきた課題でもあります。 映画「サンダーボルト5」に登場するロボット「No.5」 画像出典: 映画「サンダーボルト5」のスクリーンショット 理想的には、感情知能と知能の両方を備えたデジタル人間やロボットはどのようなものになるでしょうか? デジタルヒューマンは主に仮想空間でシミュレートされ、デザインの余地が広く、日常生活では見づらいシーンやより豊かなシーンを提供します。一方、ロボットは現実空間に存在し、目で見て触れることができ、行動的にも物理的にも人間とやりとりできるため、より多くの課題が生じます。 アプリケーションの観点から見ると、デジタルヒューマンとロボットは、私たちが期待するシナリオへと絶えず拡大しています。 たとえば、現在ではインターネット プラットフォーム上で多くのデジタル パーソンがニュースを報道したり、興味深いストーリーを語ったりしています。過去 2 年間、これらのデジタル ピープルは口を開けて話したり、他の動作をしたりしていましたが、非常に機械的で、おそらく一目見ただけで偽物だとわかるでしょう。現在、多くのデジタルヒューマンのシミュレーションレベルは非常に高く、多くの感情表現や動きが伴います。 新華社は以前、AI合成アンカーの3Dバージョンを公開した。画像提供:新華社 一方で、工場内のロボットやコーヒーを作るロボットなど、私たちの日常生活にはすでに多くの自動化ロボットが存在していますが、それらと私たちとのやりとりは、今のところ比較的機械的なやりとりに過ぎないのかもしれません。コマンドを送信すると、フィードバックが返され、コーヒーを淹れたり、自動車部品を作ったりといったコマンドが実行されます。 しかし、私たち人間は依然として外界との多くの感情的な交流を必要としており、周囲の環境に溶け込むことを望んでいます。たとえば、家の中で猫や犬と遊んだり、一緒に過ごしたりすることができます。おそらく、漫画「ドラえもん」を見たことがある友人の多くは、ドラえもんを家に置きたいと思うでしょう。それは、ドラえもんがポケットから欲しいものを取り出せるからだけではなく、友達のように、あなたが不幸なときに慰め、幸せなときに一緒にいてくれるからです。これは、「生活に溶け込むロボット」の典型的な例であり、とても自然に溶け込んでいます。 画像出典: ドラえもんアニメのスクリーンショット 感情的なやりとりは私たち人間にとって非常に重要です。日々の生活の中で、私たちは感情的にコミュニケーションできる相手が欲しいと願っています。ロボットであれデジタルヒューマンであれ、それが単なるタスクを完了するためのツールではなく、私たちの生活にもっとうまく統合されるものになることを願っています。 例えば、この2年間で大きな注目を集めたスマートコンパニオンロボットは、決して単なる冷たい機械ではありません。突然コーヒーマシンが近づいてきて、コーヒーを飲みたいかと尋ねてきたら、奇妙な光景になるかもしれません。しかし、あなたの意見を聞き、あなたの考えを理解し、さらにはあなたの動きや生活習慣から現在の状態を理解することができれば、これは私たちが将来取り組むべき方向です。 ギャラリー内の画像は著作権で保護されています。転載して使用すると著作権侵害の恐れがあります。 デジタル人間やロボットの感情知能を評価するにはどうすればよいでしょうか? ロボットやデジタルヒューマンの「感情知能」をどのように評価するかも、知能を評価するよりも難しいため、学界が非常に懸念している問題です。 知能のレベルを定量的に評価したい場合は、タスクごとに異なる評価指標を設計できるようになりました。たとえば、自動運転には現在、L0 から L5 までのさまざまなレベルがあります。しかし、感情的または感傷的な観点からそれを定量化することは依然として困難です。たとえば、何かに対する反応が幸せか不幸か、もちろん幸福度を 1 から 10 までの尺度で表すことはできますが、これを定義するのは実際には困難です。 私たちは皆、デジタル人間やロボットが人間とシームレスにコミュニケーションできるようになることを望んでいます。以前は、機械が人間であるか機械であるかを区別できるかどうかを評価する「チューリングテスト」という非常に典型的なテストがありました。感情的な側面からの評価も同様です。感情的コミュニケーション能力の強さと感情的動機付けの有効性をどのように評価するか?今では、顔の表情から感情を判断するなど、多くの特定のタスクでこれを評価できます。しかし、より一般的で完全な分析モデルには、さらに調査と標準化された評価が必要であり、「どのような感情状態に達したか」を評価するための基準を形成する必要があります。これは将来必ず必要になります。 「感情的にも知的にもバランスが取れている」というのは、いったい何がそんなに難しいのでしょうか? 前述のように、デジタルヒューマンは非常にリアルに見えます。これは実際には、コンピュータ グラフィックスと仮想現実の次元から、動きをより連続的にし、シミュレーション シーンをよりリアルにする方法を検討した結果です。これは、外観の観点から問題を検討しています。 しかし、「感情と知性」を気にするなら、外見の真実性に加えて、外部からのフィードバックに反応する際の感情表現と正確な感情判断にもより注意を払うべきです。 ギャラリー内の画像は著作権で保護されています。転載して使用すると著作権侵害の恐れがあります。 デジタル人間やロボットがこれをよりうまく実行できるようにするには、人間の感情の生成メカニズムといくつかの表現をより基本的な観点から理解する必要があります。つまり、デジタルヒューマンやロボットに外部信号に基づいて人間の感情を分析・判断することを教えるだけでなく、さまざまなシナリオでどのような変化や影響が生じるかなど、人間の脳自体の観点から人間の感情状態を理解する必要があるのです。例えば、うつ病や自閉症の子どもなど、特定の病気を患っている患者の中には、普通の人とは感情状態が若干異なる人もいます。そのため、これらの違いをよりよく認識することが非常に重要です。たとえば、車の組み立てやコーヒーの注ぎを手伝ってくれるロボットを作ることができますが、病気の前兆を特定したり、自閉症や認知障害のある人に診断サービスや精神的なケアを提供したりすることもできるかもしれません。 私たちは、ロボットやデジタルヒューマンが、感情面と知的面の両方から人間にアプローチし続けることを願っています。もちろん、私たち自身の感情的認知能力を探求するには、まだ長い道のりが残っています。 一方で、脳認知研究のレベルを向上させる必要があると思います。脳は非常に複雑なため、その動作メカニズム、さらには私たち自身の認知、感情の原因、感情の分析などを完全に理解するには程遠い状態です。まだ長い道のりが残っています。一方、こうしたデジタルヒューマンやロボットの能力をさらに強化するためには、新たな技術も必要です。これら 2 つの路線はどちらも前進しているかもしれませんが、どのように統合し、最終的な道がどこにつながるのかについては、長期間の検討が必要になります。 感情計算や感情判断を行うためのデータが大量にある場合、このデータを使用していくつかのモデルをトレーニングし、それを使用してこの状況での人々の通常の感情が何であるかを判断する場合、これは初期段階に属すると思います。 しかし、将来のより一般的な段階では、異なる人々のグループ間の特定の感情の違い、さらには異なる地域や特定の環境の違いも考慮する必要があります。これらの個人化された多様な特性により、感情の計算と感情の判断が非常に困難になります。 ギャラリー内の画像は著作権で保護されています。転載して使用すると著作権侵害の恐れがあります。 この観点からすると、デジタルヒューマンやロボットが人間と感情的なやりとりを実現することは確かに困難です。なぜなら、人は皆独立した個人であり、パーソナライズ自体が難しいからです。たとえば、トークショーのジョークを聞いたとき、聴衆はそれぞれ異なるフィードバックをするのは間違いありませんが、フィードバックを収集して調査を行うために、各人にジョークを機械的に 100 回繰り返すことは困難です。 この場合、外部の反応に基づいてリアルタイムでフィードバックを与え、そのペースを調整することが非常に重要です。人間の方がこの点では優れているかもしれませんが、ロボットにより適切なパーソナライズされたフィードバックを与えさせたい場合、克服すべき技術的な困難がまだ多くあります。 たとえば、私たちが外の世界の物事を見るとき、多くの視覚データ、聴覚データ、その他のさまざまな感覚データを受け取ります。外界に対するこれらの反応は、1、2、3、または 4 つの特定の状況に単純に分類できないことが多く、内部のつながりはより複雑です。コインを投げるのと同じように、表か裏かのどちらかですが、真ん中で揺れている状態も存在する可能性があることがわかります。これにより、判断がさらに難しくなります。 多くの感覚情報データは不完全である可能性があるため、カメラやさまざまなセンサーが満載のデバイスに人を入れて観察することは困難です。これは被験者に大きな不快感を与えるため、実現は困難です。限られたローカル情報のみに基づいてインテリジェント モデルをトレーニングすることで、人の現在の状態をよりよく理解し、フィードバックを提供することはさらに困難です。 さらに、これらのモデルやメソッドをデジタルヒューマンやロボットに組み込む場合、ユーザーとのインタラクションを可能にするために解決すべき問題がまだ多く残っています。たとえば、コンピューティングの効率性という点では、何かを話しかけると、フィードバックが返ってくるまでに 10 秒かかります。動けなくなったように感じ、体験が非常に悪くなります。リアルタイムでフィードバックを提供するには、コンピューティング効率とチップなどのハードウェアの問題の両方を解決する必要があり、これらはすべて改善する必要があります。 どうすれば解決できるでしょうか? 「感情知能と認知能力を兼ね備えたデジタルヒューマンとロボット」の背後には、実は非常に複雑な問題があり、徐々に解決しなければならない技術的な困難が数多くあります。 これには問題のいくつかの側面が関係します。 一方で、より豊富なデータが必要です。 多くの人工知能手法ではデータのサポートが必要です。近年、感情コンピューティングに注目する研究者が増え、モデルのトレーニングをサポートするためにより多くのデータを入手できるようになりました。さらに、ハードウェア技術の進歩により、コンピューティング能力とセンサー技術も急速に向上し、データの収集が容易になりました。例えば、昔は脳波データを収集するのは非常に困難でしたが、今では脳波収集装置は比較的使いやすくなりました。 近年、感情に関する医学、心理学、脳科学の研究も急速に発展しています。多くの研究成果が関連分野の医師とともに議論され、検討されます。大量の追跡データは、内部表現と外部表現の違いを含め、人々の感情状態をより適切にモデル化し、理解するのに役立ちます。これらは、人間の感情に関係する要因や、話し方や行動などの外部表現と脳内の変化との関係を理解するのにも役立ち、ひいては人の感情を判断するのに役立ちます。これらの学際的な科目の統合は、感情の認識と理解にとって重要な画期的な道筋も提供します。 ギャラリー内の画像は著作権で保護されています。転載して使用すると著作権侵害の恐れがあります。 さらに、ハードウェア技術の進歩も非常に重要です。 デジタルヒューマンはハードウェア形式を必要とせず、ヘッドフォンや画面などのデバイスを通じて対話することができます。しかし、ロボットは運搬者の問題を解決する必要があります。シナリオによっては、ロボットが車を持ち上げることもできますが、他のシナリオでは、ロボットに優しく握手してもらうことも必要です。多くの実践的な活動において、私たちが望むことを正確かつリアルタイムで実行させたい場合、機械、材料、センサーなど他の分野の関与が必ず必要になります。 企画・制作 インタビューを受けた専門家:清華大学准教授、中国画像グラフィックス学会感情計算・理解委員会常任委員、高岳氏 ヤン・ヤン編纂 企画丨孫静亜 中国映像グラフィック協会 ディンゾン 編集者: ヤン・ヤン 校正:徐来林 |
<<: 大雨と激しい対流に二重の警告!洪水防止の重要な時期に、どのように科学的な予防策を講じてリスクを回避するのでしょうか?
>>: お茶の科学 |福建省の香り高い茶樹品種における「90年代後」と「00年代後」の起源が明らかに!
7月以降、エコバックスの株価は下落し続け、何度も連続して下限値を下回った。現在、株価は1株当たり約...
羊肉の串焼きは、特に夏には多くの人に好まれています。夜にビールを飲みながら羊肉の串焼きを食べる人も多...
ダーク料理界に「トマトロールアウェイ」という新商品があると聞きました。友達に衝撃を与えました。では、...
制作:中国科学普及協会著者: 中国科学博覧会プロデューサー: 中国科学博覧会神舟19号宇宙飛行士乗組...
サツマイモを食べることの利点サツマイモは一般的な全粒穀物製品です。サツマイモを食べることは、人間の健...
多くの人が手羽先を食べるのが好きです。手羽先は私たちの生活の中で非常に一般的な食材でもあり、通常は市...
メスのイカの卵に包まれた腺はイカ卵と呼ばれます。イカ卵の調理法は様々です。イカ卵を食材として使い、他...
シジギウムはブドウではありません。この2つは完全に異なる種です。大きさ以外に類似点はありません。厳密...
本日、LG は新世代のフラッグシップモデル G3 を正式に発売しました。 2K スクリーンを搭載して...
妊娠は女性の人生における特別な時期であり、非常に重要な責任を負っています。このとき、家族は彼女をより...
皆さんは、学生時代に、毎日進歩することの大切さを証明するために、多くの教師が 1.01 の 365 ...
現代の労働者は、一日の仕事を終えて家に帰ると、ただベッドに横になって何もしたくないと思っています。肉...
麺は中国人の主食の一つです。麺の調理法は様々で、地域によって麺の特徴も異なります。河南省で最も有名な...
雪梨の効能は、熱を清め、解毒し、咳を和らげるなど、その効果は非常に顕著です。しかし、梨は果物の一種な...
牛乳の摂取方法というと、「飲む」ことしか思い浮かばない人も多いかもしれません。実は、牛乳はただ「飲む...