「曲院鳳河へ向かう途中、サンルーフを開けてジェイ・チョウの昔の歌を聴くつもりです。」 これを人に言えば、あなたの3つの意図は簡単に理解されるでしょう。1つは、曲院鳳河に行くこと。 2、天窓を開ける。 3、ジェイ・チョウの昔の曲を聴く。 しかし、人間を車などの機械に置き換えた場合、車は理解して対応する操作フィードバックを与えることができるでしょうか? ご存知のとおり、音声は操作が便利で安全であるため、車内での対話に最も適した方法の 1 つです。現在、各社が提供している音声ソリューションには大きな違いがあるものの、車載ソリューションの業界標準としてほぼ定着しつつあります。たとえば、冒頭で述べた意味理解マルチタスクは、業界ではまだ比較的新しい技術アプリケーションです。まだ導入していない企業はほとんどありません。ほとんどのメーカーは、音声認識と自然言語理解の精度の向上に重点を置いています。 AliOSデータインテリジェンス部門の責任者である陳華良氏は、現在音声技術のアップグレードを進めており、シーンベースのインテリジェントな意味理解(SSLU:シーンベースの音声言語理解)の体験向上に注力していることを明らかにした。これは、自然言語理解とシナリオベースの言語理解に基づく言語理解のインテリジェントなアップグレードであり、マルチドメインタスク処理機能の向上も含まれる。 一般的な対話システムは、通常、自動音声認識 (ASR)、自然言語理解 (NLU)、対話管理 (DM)、自然言語生成 (NLG)、テキスト読み上げ (TTS) などの複数のモジュールで構成されています。 AliOS は現在、革新的なセルフプレイ対話トレーニング データ生成およびクラウドソーシング ソリューションを実装しており、人、車、シナリオの包括的な理解、言語的、意味的事前知識、およびナレッジ グラフ知識の対話システムへの移行、エンドツーエンドのディープラーニング対話システム モデルのトレーニング、シナリオ カバレッジと対話の流暢性の向上、およびシステムがシナリオに基づいて音声コマンドをよりよく理解できるようにすることを組み合わせていると報告されています。 冒頭で述べたコマンドを例にとると、AliOS はまず「サンルーフを開けて、ジェイ・チョウの昔の曲を聴きながら、曲院鳳河へ行きたい」という文章の各単語を正確に認識し、次にユーザーの現在の使用シナリオを組み合わせて文章の意味を理解し、関連サービスを呼び出して、曲院鳳河へのナビゲーション、サンルーフの開閉、ジェイ・チョウの昔の曲の再生などの複雑な操作を実行します。 陳華良氏は次のように述べた。「話し言葉は、意味が曖昧で不完全であることが多い。話し言葉の表現を理解するには、膨大なコーパスデータだけに頼るだけでは不十分だ。人、車、シーンなどのより多くの情報があればこそ、シーンベースのインテリジェントな自然言語理解機能を実現し、ユーザーに優れた音声体験を提供できると私たちは考えている。」彼は、現在、AliOSはナビゲーション、音楽、オーディオブック、ラジオなど、いくつかの高頻度車載アプリケーションシナリオにおける音声技術の最適化とアップグレードに注力しており、多条件検索、ナビゲーションのマルチタスク、ナビゲーション中の設定変更、マルチスロットクエリなどを実現していると紹介しました。 いくつかわかりやすい例を挙げると、例えば「ここから中山公園までどのくらいかかりますか?」という質問に対して、AliOS は現在地から中山公園までの距離を尋ねていると正確に理解できます。 「以前のウェイポイントを削除」、AliOS は最後のウェイポイントを正確に削除できます。 「その場に合った曲をかけて」AliOSは、現在の天気や時間情報に基づいて適切な曲を再生できます。 さらに、AliOS はシステムの底部から音声、視覚、ジェスチャー、その他のインタラクティブな方法のマルチモーダル融合を実現し、ユーザーに没入型の体験を提供することを目指しています。車内音楽、ニュース放送、オーディオブック、車内ナビゲーションなど、さまざまなシナリオで幅広く使用されます。 今日頭条の青雲計画と百家曼の百+計画の受賞者、2019年百度デジタル著者オブザイヤー、百家曼テクノロジー分野最人気著者、2019年捜狗テクノロジー文化著者、2021年百家曼季刊影響力のあるクリエイターとして、2013年捜狐最優秀業界メディア人、2015年中国ニューメディア起業家コンテスト北京3位、2015年光芒体験賞、2015年中国ニューメディア起業家コンテスト決勝3位、2018年百度ダイナミック年間有力セレブなど、多数の賞を受賞しています。 |
<<: テスラ、上海臨港の工業用地を9億7300万人民元で取得
>>: Ideal ONEが採用した長距離ハイブリッド電気自動車が中国市場に適していないと言われるのはなぜですか?
フランスのクレープを食べたことがある人は少なくないと思いますが、作り方を知らない人も多いのではないで...
業界全体で、人工知能 (AI) と生成 AI (GenAI) をめぐる議論は、潜在性から価値実現へと...
もし株価が今日も一日の制限値に達した場合、ストーム・テクノロジーはIPO再開以来24日連続の一日の制...
この記事は天津大学泰達病院の副主治医である趙偉医師によってレビューされました。出典: Minitor...
ココナッツを食べることの主な利点は、体内の栄養を補給し、肌を美しくし、利尿を促進し、腫れを軽減できる...
VR デバイスは数年前から注目を集めています。初期の安価な VR 紙箱から高価な VR ヘッドセット...
トゥチョンクリエイティブ涼しく爽やかな秋の日々が続く中、再び中秋節を迎えます。旧暦の8月15日は、家...
日々の食生活や健康に気を配らないと、気管に多少なりとも影響が出る可能性があります。これは成長期の子供...
クコの実は非常に一般的です。この種の食品は人体に非常に良い効果があり、特に病気の治療に効果があります...
人間の体の大部分はタンパク質であることは周知の事実ですが、ホエイプロテインパウダーはタンパク質を豊富...
10月8日、レノボ・ホールディングスの劉氏はインターネット上でアドバイスを求める投稿をし、インターネ...
SF映画では、JARVISのようなAIシステムはほぼ全能であり、人間がさまざまな困難な問題を解決する...
ミックスピーナッツが好きな人はたくさんいます。味が良いだけでなく、ワインにもよく合います。特にお酒が...
この記事は、河北胸部病院呼吸器・集中治療科の副主任医師である李江涛氏によってレビューされました。春の...
家事が得意な人でも、大麦、小豆、キビのお粥を作ったことがないかもしれません。それは主に、この3つの材...