Sogouが4つのAIボイスレコーダーをリリース、4つのコア機能でAI録音の新時代を切り開く

Sogouが4つのAIボイスレコーダーをリリース、4つのコア機能でAI録音の新時代を切り開く

ボイスレコーダー業界は常に「単純な」業界であると考えられてきました。市場に出回っているほとんどのボイスレコーダーを見ると、ほとんどのユーザーの録音ニーズを満たしているだけであることがわかります。確かに、ボイスレコーダーの目的からすると「録音」が主なテーマになるはずですが、だからといってボイスレコーダー製品にもっと想像力を働かせることができないということではありません。

2020年2月26日、Sogouはオンライン記者会見を開催し、Sogou AIボイスレコーダーS1、E1、S1故宮共同ブランド版、C1 PRO故宮共同ブランド版の4つの新しいボイスレコーダーを発表しました。

実際、名前の「AI」という言葉から、Sogou は「群衆と区別がつかない」従来のボイスレコーダーを作るつもりではなく、AI 技術とハードウェアを統合して、ユーザーの録音ニーズを総合的に解決できる人間化された録音製品を作りたいと考えていることがわかります。

この意味で、Sogou はまさに従来のボイスレコーダーの製品思考から脱却し、AI 録音の新時代を切り開きました。機能面だけから見ても、Sogou AI ボイスレコーダーには革命家が持つべき要素がすべて備わっています。

4つの主要機能が新しい体験を生み出す

製品の観点から見ると、Sogou は AI を基盤として採用し、スーパーサウンドピックアップ、正確な文字起こし、効率的な整理、万能翻訳という業界をリードする 4 つの主要機能を実現し、ボイスレコーダーにおける高次元のブレークスルーを実現しました。

優れた集音力でどんなシーンでも録音可能

まず、ボイスレコーダーに対する最も基本的な要求は「録音」ですが、製品の性能上の限界により、ほとんどのボイスレコーダーは強風やスタジアムなどの過酷な状況で「故障」し、ボイスレコーダーの使用における不確実性が大幅に高まります。

この問題を解決するために、Sogou は死角のない遠距離シーンに対応するスーパーサウンドピックアップ機能を独創的に追加しました。

ハードウェア面では、Sogou AI ボイスレコーダー S1 には 2 つの Harman 指向性マイクが搭載されており、最大 10 メートルの集音距離をサポートします。また、6 つの全方向性マイクを搭載しており、死角のない 360° 全方向の音声収音をサポートします。アルゴリズムレベルでは、Sogou AI ボイスレコーダー S1 は業界で初めて AI ノイズ低減を実装しました。 8 チャンネルのマイク信号を包括的に分析し、pureVoice AI ノイズ低減アルゴリズムに基づいて、高度なインテリジェント ノイズ低減を実現します。 40,000 以上の実際のノイズをリアルタイムでフィルタリングし、録音された人間の声をより明瞭にします。

一方、Sogou AIボイスレコーダーは、レコーダーまでの距離が遠くても音声を明瞭に録音できます。一方、Sogou AI ボイスレコーダーは、インテリジェントなノイズ低減機能により、無駄な音声情報を巧みに除去することができます。これら 2 つの要素の組み合わせにより、Sogou AI ボイスレコーダーは、特別な使用シナリオに制限されない業界初の録音製品となり、フルシーン録音の時代を切り開きました。

正確な転写は作業効率を大幅に低下させる

録音が完了したら、多くの人が録音内容をテキストに整理する必要があると思いますが、これは現在の従来のボイスレコーダーの最大の欠点でもあります。録音を聞きながらテキストに入力する必要があるのです。短い録音であれば問題ありませんが、録音が数時間にわたると、作業量は飛躍的に増加します。

そのため、Sogou は録音のリアルタイムテキスト転記機能を導入し、業界水準を上回る転記精度を維持しました。新しいSogou AIボイスレコーダーの文字起こし精度は98%に達しました。

Sogouによると、AIリアルタイム連携とSogou入力方式の語彙同期により、Sogou AIボイスレコーダーS1は「1時間の録音と5分での原稿作成」を実現できるという。つまり、録音をテキストに変換するのにかかる時間はわずか数分で、変換精度は98%と非常に高いのです。手作業と比較すると、Sogou AIボイスレコーダーS1は変換効率がはるかに優れています。

もちろん、Sogou はさまざまな言語や方言での録音シナリオも考慮に入れています。テキスト変換に関しては、中国語、英語、日本語を含む10の言語と、広東語、四川語、河北語を含む10の方言の認識をサポートしています。また、金融・貿易、医療、IT技術など5つの分野における専門用語の徹底学習も行います。これにより、Sogou AIボイスレコーダーの使用シナリオが大幅に拡大しました。

興味深いことに、Sogou AI ボイスレコーダーには強化された認識機能もあり、さまざまな話者や拍手、笑い声を認識できるため、ユーザーは正確に音声を録音できます。

録音業界の観点から見ると、正確な転写機能は、抽象的な音声を直感的なテキストに変換し、音声の直感性を大幅に高めることで、作業効率を大幅に向上させることができます。

効率的な整理により、録音ファイルを直感的に操作できます

オーディオ ファイルの数が増えるにつれて、従来のオーディオ レコーダーのほとんどのユーザーは、オーディオ レコーダー内のファイルを有線接続でコンピューターに転送し、コンピューターを介してオーディオ ファイルを整理することしかできず、単純な名前タグしかサポートしていないと思います。ただし、ビデオや写真をアーカイブするこの方法は、抽象的な記録にはあまり適していません。

ユーザーが録音をより良く整理できるようにするために、Sogou はインテリジェント要約技術を開発しました。Sogou Zhiyin™ NLP エンジンのインテリジェント要約技術により、録音原稿のテーマと重要な文章が自動的に洗練されます。たとえば、録音からキーワードを抽出して録音ラベルを作成すると、録音の直感性が大幅に向上します。

録音を検索するときは、音声アシスタントを通じて検索したいキーワードを言うだけで、Sogou AI Voice Recorder S1 がそのキーワードを含むすべての録音を表示します。 Sogou AI Voice Recorder S1 は、録音を聞き返す際に、空の録音をスキップしたり、繰り返しの単語をフィルタリングしたり、無駄な情報を可能な限り排除して、録音の連続性を高めることもできます。

興味深いことに、ユーザーがファイルを整理しやすくするために、Sogou AI ボイスレコーダーの録音ファイルは、モバイルアプリ、Web ページ、PC クライアントなどのさまざまな端末にリアルタイムで同期できるため、プラットフォーム間で録音ファイルを整理する際の効率が大幅に向上します。

ユニバーサル翻訳にはもはや「同時通訳」は必要ない

外国語のインタビューや外国語のスピーチなど、録音中に全く新しい言語に遭遇すると、誰もが戸惑うと思います。それは、まずその言語の範囲がわからず、その言語で話されている内容の意味がわからないからです。この需要に応えるために、Sogou は翻訳機能を Sogou AI ボイスレコーダー S1 に巧みに統合しました。つまり、Sogou AI ボイスレコーダー S1 は会話翻訳機能をサポートし、業界で初めて無料の会話翻訳をサポートしました。

Sogou によると、Sogou AI ボイスレコーダー S1 は 63 の言語でのオンライン翻訳をサポートしています。オフラインモードでは、中国語、英語、日本語を含む9つの一般的な言語の翻訳もサポートできます。これを基に、Sogou AI ボイスレコーダー S1 と E1 は中国語と英語のリアルタイム同時通訳もサポートしており、これは、これら 2 つの Sogou AI ボイスレコーダーが、これまで「同時通訳」でしか実現できなかったタスクを完了できることを意味します。

長い間、ボイスレコーダー業界は「録音」という言葉に制限され、ある種のボトルネックに陥っていたようです。しかし、Sogou の先駆的な思考は、「録音」という言葉から逸脱し、スーパーサウンドピックアップ、正確な転写、効率的な組織、そして万能翻訳という 4 つの革新的な機能を創造的にもたらしました。これにより、業界全体に新たな開発アイデアがもたらされる可能性があります。

Sogou は、ボイスレコーダーに初めてこれらの独創的な機能を追加することで、AI 録音の新時代の先駆者としての地位を確立しました。市場の観点から、この先駆者の高い魅力をはっきりと感じることができます。

新世傑産業研究センターが発表した「2019-2023 ボイスレコーダー産業の詳細な市場調査と投資戦略推奨レポート」のデータによると、中国のボイスレコーダー産業の出荷量の伸びは2017年以降、基本的に停滞している。Sogou AIボイスレコーダーC1は2019年3月に発売され、3か月後にはボイスレコーダー部門で販売チャンピオン、JD.comとTmallプラットフォームでそれぞれ販売チャンピオンを獲得した。その年のダブルイレブンでは、Sogou AIボイスレコーダーC1がJD.comとTmallの両プラットフォームで単一製品の総売上高で優勝しました。

Sogou がリリースした 2 つの新製品は、以前の製品をベースに全面的に進歩したことを考えると、2020 年には Sogou AI ボイスレコーダーの市場が拡大すると予測されます。同時に、最も初期の AI ボイスレコーダーの先駆者として、Sogou の高度な成果は、確かに伝統的なプレーヤーから学ぶ価値があります。

今日頭条の青雲計画と百家曼の百+計画の受賞者、2019年百度デジタル著者オブザイヤー、百家曼テクノロジー分野最人気著者、2019年捜狗テクノロジー文化著者、2021年百家曼季刊影響力のあるクリエイターとして、2013年捜狐最優秀業界メディア人、2015年中国ニューメディア起業家コンテスト北京3位、2015年光芒体験賞、2015年中国ニューメディア起業家コンテスト決勝3位、2018年百度ダイナミック年間有力セレブなど、多数の賞を受賞しています。

<<:  休暇後に仕事の効率を2倍にするにはどうすればいいでしょうか? Sogou AIボイスレコーダーC1 Proで答えをお伝えします

>>:  リモートワークの失敗を避ける方法:DingTalk、WeChat for Work、Larkのうちどれがあなたに適していますか?

推薦する

空腹感を抑える5つの「スイッチ」

肉になると我慢できなくなり、高脂肪・高糖質の食べ物には抵抗力がなくなり、空腹が長く続くとついついたく...

白酢とは何ですか?

皆さんは白酢をよくご存知だと思います。白酢は私たちが最もよく使う調味料の一つです。白酢は多くの料理の...

運動後に冷たいシャワーを浴びると、心臓発作の致命的な原因になる可能性があります。これらの心臓発作の警告を無視してはならない

47 歳の劉さんはスポーツが大好きで、特に数人の友人とバスケットボールをするのが好きです。最近は暑か...

探索 |夜空で最も明るい星、そして宇宙で最も明るい星

古代の詩人たちの著作では、星には豊かな象徴的な意味が与えられていました。 「夜は空に溢れる水のようで...

脳さえ持たないスライムは、実際に都市のルートを計画することができます

スライムといえば、皆さんもよくご存知でしょう。小説やアニメにもその名前はよく登場します。ゲームをたく...

龍井茶は緑茶ですか?

龍井茶は中国国内でよく知られているだけでなく、多くの外国人も龍井茶を知っています。龍井茶は国内外で有...

妊婦はエビを食べても大丈夫ですか?

妊娠中の女性は体の抵抗力が比較的弱く、食べ物に対して非常に敏感であることは誰もが知っています。誤って...

300トンの地上近くへの配達?宇宙開発の時代において、将来ロケットの容量はどのくらい大きくなるのでしょうか?

最近、米スペースXのイーロン・マスクCEOは、「スターシップ」は非回復モードを採用し、低軌道容量は3...

トヨタは敗北を認め、米国に100億ドルの投資を発表。米国最大のトロールであるトランプは笑っている。

トヨタ自動車は最近、今後5年間で北米に100億ドルを投資すると発表した。トヨタは過去60年間にわたり...

海のラブストーリーシリーズ |アシの古い墓は一緒に:幼なじみの恋人、死ぬまで一緒に暮らす

01あなたと手を繋ぎ、共に年を重ねていくAさんと妻は一緒に埋葬されました。画像出典: NOAAこれは...

酢の9つの効能を数えてみましょう

酢は女性にとって良いものです。健康と美容に多くの効果があり、夏の女性にとって良い助けになります。女性...

中国東北部の人はクランベリーを食べたことがあるのでしょうか? |エキスポデイリー

中国東北部の人はクランベリーを食べたことがあるのでしょうか?富源は北東部の小さな国境の町です。我が国...

インゲンの栄養価

緑豆は青大豆とも呼ばれ、新鮮な豆の一種です。子葉の分類によると、緑色の皮を持つ緑大豆と緑色の皮を持つ...

最盛期突入!悲劇が起きないようにするには、次の 8 つの行動に注意してください。

過去1ヶ月間で、全国で溺死事故が多数報告されている。大学入試も終わり、夏休みが近づいてきましたので、...