ロボットに「常識」を自ら学ばせる?人間を必要とせずに、複雑な家事を自己修正して完了することができます。

ロボットに「常識」を自ら学ばせる?人間を必要とせずに、複雑な家事を自己修正して完了することができます。

ロボットは人間の模倣者として優れていますが、そのほとんどは、事前設定されたプログラミングなどの人間の助けなしには動作できません。特に家庭用ロボットの場合、複雑な家事に直面したときに「脳」に十分な常識がなければ、人間の家族の日常的なニーズを満たすことは困難になるでしょう。

現在、大規模言語モデル(LLM)によって駆動される家庭用ロボットは、すでに「常識的な知識」を獲得し、人間の助けなしに自らを修正し、複雑な家事をうまくこなすことができます

「反事実的摂動によるデモンストレーションにおける言語計画の根拠付け」と題された関連研究論文が、トップクラスの人工知能(AI)カンファレンス ICLR 2024 の会議論文として発表されました。

ヤンウェイ・ワン博士マサチューセッツ工科大学(MIT)の電気工学およびコンピュータサイエンス学部の学生であり、この研究論文の責任著者です。

同氏は、模倣学習が家庭用ロボットを実現するための主流のアプローチであると述べた。しかし、ロボットが人間の動作の軌跡を盲目的に模倣すると、小さなエラーが蓄積され続け、最終的には実行プロセスで他のエラーが発生します。 「私たちのアプローチにより、ロボットは実行エラーを自己修正し、全体的なミッションの成功率を向上させることができます。

ロボットに家事の一部をマスターさせよう

こぼしたものを拭き取ることから料理を配ることまで、ロボットはますます複雑化する家事のやり方を学んでいます。実際、多くの家庭用ロボットは人間の行動を模倣して学習します。ロボットは、人間が指示した動作を再現するようにプログラムされています。しかし、過去のロボットには常識が欠けていたため、人間のエンジニアがあらゆる衝撃や衝撃に適応するようにロボットをプログラムしない限り、ロボットは必ずしもこうした状況に対処する方法を知っているわけではなく、ゼロからミッションを始めなければならなくなる

おそらく、ある程度の「常識的な知識」を組み込むことで、ロボットは訓練の道から外れるような状況にも備えられるようになるだろう。論文によれば、Yanwei et al.簡単な日常的な作業を通じて、提案された方法の有効性を検証しました。一つのボウルからビー玉をすくい取り、別のボウルに注ぐという作業は、とても簡単なように思えます。

しかし、従来の方法では、ロボットがこのタスクを完了できるようにするために、エンジニアはロボットに「すくう」および「注ぐ」動作を流体軌道上で完了させ、それを何度も繰り返して、ロボットが人間のデモンストレーション動作の一部を模倣できるようにしていました。

問題は、人間はタスクを一度で実行できるかもしれないが、そのタスクは一連のサブタスク、つまり軌跡に依存している点です。たとえば、ロボットは水をすくう前にボウルの中に手を伸ばさなければならず、空のボウルに移動する前にビー玉をすくい上げなければなりません。ロボットがこれらのサブタスクのいずれかの途中で揺さぶられたりミスをしたりした場合、唯一の手段は停止してやり直すことです。

人間のエンジニアが各サブタスクに明示的にラベルを付けてロボットをプログラムしたり、新しいデモンストレーションを収集したりしない限り、ロボットはそのような障害から回復し、一瞬で自分自身を修正することができます。 「このレベルの計画は非常に面倒だ」とヤンウェイ氏は語った。

そこで、この研究では、ヤンウェイ氏と彼のチームは、ロボットの動作データを大規模言語モデルの「常識的知識」と結び付けました。

これにより、ロボットは与えられた多くの家事タスクを論理的にサブタスクに解析し、サブタスク内の注意散漫に適応できるようになりました。これに基づいて、ロボットは戻って最初からタスクを開始する必要なく、前進し続けることができます。そして重要なのは、人間のエンジニアは起こりうるあらゆる障害に対して詳細な修正を書く必要がないということです。

これらのディープラーニングモデルは、大規模なテキストライブラリを処理し、単語、文、段落間のつながりを確立できることが報告されています。これらの接続を通じて、大規模な言語モデルは、前の単語に続く可能性のある単語の種類について学習した内容に基づいて、新しい文を生成できます。

さらに、大規模な言語モデルでは、文章や段落に加えて、プロンプトに基づいて特定のタスクに関係するサブタスクの論理リストを生成することもできます。たとえば、ビー玉をボウルから別のボウルにすくい上げる動作をリストアップするように求められた場合、モデルは「手を伸ばす」「すくう」「運ぶ」「注ぐ」などの動詞のリストを生成する可能性があります。

「大規模な言語モデルは、自然言語を使用してタスクの各ステップを完了する方法をロボットに指示できます。人間による継続的なデモンストレーションは、これらのステップを物理空間で具体化したものです」とヤンウェイ氏は語った。 「ロボットがタスクのどの段階にいるのかを自動的に認識し、自ら再計画して回復できるように、この2つを接続したいと考えています。

ヤンウェイ氏によると、彼らのアルゴリズムは遠隔操作システムによって収集されたデータを堅牢なロボット動作に変換できるようになり、外部からの干渉にもかかわらずロボットが複雑なタスクを完了できるようになるという。

欠点と展望

このアプローチにより、ロボットは人間の支援なしに自己修正して複雑な家事作業を実行できるようになりますが、一定の制限もあります。たとえば、彼らのアプローチでは、大量の人間によるデモンストレーションは必要ありませんが、軌跡のタスク成功ラベルを収集するためには、広範囲にわたる試行錯誤とリセット可能な環境が必要です。

しかし、研究チームは、このデータの非効率性の問題は能動学習によって解決できると述べています。さらに、大規模な言語モデルに、分類器を学習するための適切な状態表現を見つけさせるには、ある程度のスキルも必要です。今後の研究では、パターン分類器を組み合わせて、エンドツーエンドで状態表現を学習したいと考えています。

参考リンク:

https://sites.google.com/view/grounding-plans

https://news.mit.edu/2024/engineering-household-robots-have-little-common-sense-0325

https://openreview.net/forum?id=qoHeuRAcSl

https://techcrunch.com/2024/03/25/large- language-models-can-help-home-robots-recover-from-errors-without-human-help/

https://www.youtube.com/watch?v=uerMlHmgPfI

https://yanweiw.github.io/

<<:  本当に素晴らしいです! 「車を洗うとすぐに雨が降る」といつも感じていませんか?

>>:  地下鉄のトンネルはどんな感じでしょうか?なぜほとんどが丸いのでしょうか?

推薦する

風邪のときに食欲を増進させるには何を食べるべきか

ほとんどすべての人が風邪をひきます。風邪をひくと食欲がなくなり、口に合わないものは何も食べたくなくな...

月の巨大なクレーターに地下トンネルが発見された。月面基地の理想的な場所になるかもしれない。 |エキスポデイリー

月の巨大なクレーターに地下に通じるトンネルがあるかもしれない月面にはスカイライトと呼ばれるクレーター...

大型スクリーンの影響力低下というジレンマの裏に、メーカーはリビングルームを生活の中心に作り変えたいという野心を隠している。

感染症流行に伴う「全員在宅」モードは、大画面テレビの運命を根本的に変えることはなかった。 Aowei...

iFlytekの自動車事業は30%成長し、上半期の総売上高は32億1000万ドルとなった。

8月14日、iFLYTEKは2018年半期報告書を発表した。報告によると、2018年上半期、iFL...

Nut 3 レビュー: 驚くほどバランスの取れたデザインとバッテリー寿命に感動

1,000 元の携帯電話としては、Nut 3 はデザイン、パフォーマンス、バッテリー寿命の点で驚くべ...

Google Playの中国への復帰は大いに期待されており、中国のモバイルゲーム市場を再編すると期待されている。

テクノロジーブログ「VentureBeat」によると、中国には巨大なモバイルゲーム市場があるが、Go...

「エアバス」はなぜ多くのメディアを騙した中国の詐欺なのか?

全国の主要メディアが賞賛している技術の発明が実は「大きな詐欺」だと言ったら、あなたは信じますか?そう...

「2021年のトップ10科学者」、中国の火星計画の中心人物がリスト入り!

ネイチャーカバー▲ ※この記事の写真と文字はNatureより引用今日、トップ科学雑誌「ネイチャー」は...

2000年代生まれの女の子が1週間で3回部屋から逃げ出し、肺感染症を発症!クリプトコッカスは予防すべき

最近#2000年代生まれの女児が1週間に3回部屋から逃げ出し肺感染症に#このトピックはホット検索の1...

コーヒーを飲むと頭痛は和らぎますか、それとも悪化しますか?コーヒーと痛み、それは友達か敵か?

この記事のテーマは、北京協和医学院ジャーナル2024年第2号に掲載された記事「毎日のコーヒー摂取と痛...

ローストグルテンソースの作り方

スナック菓子は私たちの生活に欠かせないものとなっているようです。時々、路上でスナック菓子が売られてい...

年末の総括を簡単に完了、Huawei PC Super Terminal の実力はどれほどでしょうか?

あと数日で2022年も終わりを迎えます。過去 1 年間の混乱を振り返り、良いことを記録し、将来を計画...

本質的に有毒で死に至る可能性のある13のアイテム

おいしい食べ物ですが、野菜を食べるときは注意して気を付けてください。すべての果物や野菜が摂取に適して...

ココナッツミルクで煮込んだ雪あさり

人々の生活水準が向上したため、食生活の質も向上し、人々は健康管理にさらに注意を払うようになりました。...

もち米を食べると太りますか?

一体何を食べると太るのでしょうか?一般的に、高脂肪、高カロリーの食べ物は太りやすいです。では、もち米...