最近、マスク氏はテスラのAIデーでその実力を誇示した。ヒューマノイドロボットやスーパーコンピュータDojoの登場、そして純粋視覚ルートの動作原理のデモンストレーションは、すべて彼の技術に対する自信を明らかにしました。多くのメーカーが視覚認識の手段として LiDAR ソリューションを選択している一方で、テスラは依然として純粋な視覚のルートにこだわり、旗を高く掲げてさらに深く追求してきました。 自動運転の基本原理は、認識、意思決定、実行という 3 つのステップの組み合わせであることがわかっています。知覚層は、視覚センサーを使用して周囲の道路状況に関する情報を取得し、車体のデバイス側とクラウドを介してデータを処理し、実行コマンドを取得することで、自動車が自律走行する能力を獲得できるようにします。 3 つの基本ステップのうち、認識は最初のステップであり、その後の意思決定と実行において必須の役割を果たします。認識レベルでは、現在市場には視覚認識と LiDAR 認識という 2 つの技術的ルートがあります。 レーザーレーダー派は、カメラの視覚認識精度が不十分だと考えています。自動運転をL3レベル以上に発展させるには、レーザーレーダーを使う必要があります。視覚認識学派は、カメラが認識した環境情報はデータが豊富であり、物体を後で分類して簡単にラベル付けできると考えています。最も重要なのはコストが低いことですが、これは LiDAR では実現できないことです。 技術的な観点から分析しても、コストの観点から分析しても、2 つのソリューションの主な違いは、高度な自動運転を実現するために LiDAR の支援が必要かどうかにあります。二つの派閥はどちらが優れているかについて延々と議論した。それで、2 つの技術的ルートのうち、どちらが最後に笑うのでしょうか? LiDARと視覚認識のパフォーマンス比較 LiDAR センシング技術は LiDAR が主流で、ミリ波レーダー、超音波センサー、カメラが補助的に使用されます。 LiDAR が環境を感知する際の動作原理は、LiDAR を通してレーザー光線を放射し、放射と回復のプロセス間の時間差と位相差を測定して車両と物体の相対距離を判定し、リアルタイムの環境認識と障害物回避機能を実現することです。 LiDAR は検出距離が長く、精度が高く、耐干渉能力が強いという特徴があります。周囲の環境にある複数の物体を能動的に検出し、周囲の環境のポイントクラウドを取得して 3D 環境モデルを構築できます。夜間に光が乏しい場合でも、検出効果に影響はありません。 LiDAR は暗い光でも問題ありませんが、天候には敏感です。雨、雪、ほこり、霧などの天候は、LiDAR の認識効果に影響を与える可能性があります。 LiDAR 融合高精度マップ ソリューションは、環境への依存度が高く、計算能力の要件が大きいという視覚ソリューションの欠点を効果的に補うことができます。その性能上の利点により、ほとんどの自動車メーカーは LiDAR をレベル 3 以上の自動運転に不可欠な認識デバイスとして挙げています。 視覚認識はカメラ中心のソリューションであり、カメラのコストは LiDAR よりも大幅に有利です。カメラの価格は数十ドル程度ですが、LIDARの価格は数百ドルと数倍高くなります。さらに、カメラ技術は徐々に成熟し、高解像度、高フレームレートの撮影技術により、認識できる環境情報はより豊かになりましたが、暗い環境ではカメラの認識には限界があり、精度と安全性が低下しています。 たとえば、テスラの最も批判されているゴーストブレーキ問題は、一部のトンネルや橋の影で発生します。カメラの構造上、アルゴリズムは突然現れた影を障害物とみなし、車両が自動的に突然減速し、安全上の危険が生じます。ビジュアルソリューションにおけるハードウェアパフォーマンスを比較すると、カメラ機能は即座に圧倒されます。ソフトウェア アルゴリズムの追加により、ビジュアル ソリューションは強力なアルゴリズムを利用して、画像処理と意思決定の実行の正常な機能を確保できます。 LIDAR と比較すると、視覚認識にはより明らかな弱点があります。カメラは照明条件に依存し、認識精度が低く、アルゴリズムと計算能力に大きく依存してそれらを必要とし、データの取得とアルゴリズムの反復に対する障壁が高いのです。性能面では、LIDAR が明らかに優れています。テスラはコンピューティング能力とアルゴリズムに莫大なコストを費やし、多額の投資を行ってきました。しかし、それは常に視覚認識ルートを主張してきました。考慮すべき点は何ですか? テスラは純粋な視覚的ルートロジックに焦点を当てています マスク氏の考えでは、「純粋な視覚認識こそが現実世界の AI への道である」とされており、これは問題解決に対する同氏のアプローチでもある。 第一原理の根底にある考え方は、物事の最も基本的な条件に戻り、それをさまざまな要素に分解して構造分析を行い、目標を達成するための最適な道筋を見つけることです。 車を運転するとき、私たちは目を通して道路状況の情報を収集し、それを脳の助けを借りて処理します。理論的には、自動運転はアルゴリズム処理によって補完された視覚認識を通じて安全に運転することもできるはずです。テスラがやりたいのは、人間の視覚による情報取得能力を模倣して自動運転を実現することだ。視覚カメラの認識方法は精度が低いため、テスラは独自のデータの利点と、計算能力およびアルゴリズムを構築する能力に依存してこの欠陥を克服しています。 データに関して言えば、他の自動運転車メーカーがまだ路上テスト段階でデータを収集している一方、テスラは世界中で販売された数百万台のカメラ搭載車のおかげで、実際の道路状況に関する膨大なデータを蓄積している。ディープラーニングモデルのトレーニングに使用されるデータは、テスラのアルゴリズムにとって長い間障壁となってきた。これらのデータサンプルが蓄積される速度とアルゴリズムの効率は、他のメーカーが再現することはできず、ただ黙って見守ることしかできない。 計算能力の面では、テスラが新たに構築したスーパーコンピューター Dojo は強力な計算能力を備えています。このスーパーコンピューターは、テスラの自動運転システム向けに設定されており、オートパイロットを含む自動運転システム全体のトレーニングに集中できます。 カメラの技術レベルでも、テスラはカメラのピクセルの深度推定の代わりに「疑似ライダー」技術を使用するなど、技術革新を実現しました。 LIDAR に似たポイント クラウド関数は、一般的に 3D ターゲット検出を形成し、深度推定の精度を向上させます。 LIDARとカメラの間のギャップは縮まり始めています。 運転中は視覚に頼ります。人間のニューラルネットワークは視覚情報における距離や速度などの信号を処理できますが、テスラのニューラルネットワークも徐々に同じことができるようになっているようです。テスラの視覚認識ルートは、徐々にライダーソリューションとの差を縮めているが、その背後で支払われた代償により、後発企業が追随して模倣することは不可能であり、これもテスラにとって強力な障壁となっている。ピュアビジョンソリューションは、膨大なサンプルデータのトレーニングと学習、および高度な画像処理アルゴリズムの計算能力によってサポートされており、少数の登山家が選択する困難なルートとなることが期待されています。 テスラの主任AI科学者カルパシー氏は、今年のCVPR 2021自動運転セミナーで、純粋な視覚ベースの自動運転ソリューションは、ビデオ入力のみに基づいてニューラルネットワークを非常にうまく動作させる必要があるため、技術的に実装するのがより難しいと述べた。しかし、良い点は、「実際に動作するようになれば、地球上のどこにでも導入できる万能の視覚システムになる」ということです。 将来的には、視覚認識システムは自動車だけでなく、ロボット、ドローン、AR/VRなど、視覚システム機能を必要とするあらゆる製品に導入され、普遍的な機能となるでしょう。これはテスラの将来の検討と野望でもあります。テスラの将来ビジョンは素晴らしいものですが、現実には、現在の視覚認識ソリューションと LiDAR ソリューションの間にはまだギャップがあります。認識や知覚の問題により、テスラ車が交通事故を引き起こすという安全事故が、今でもニュースで報じられています。現時点では、安全性の面では依然としてLiDAR派がリードしています。 最後に笑うのはLiDARでしょうか? どちらの流派が最後に笑うかは、どちらの流派が大量生産やビジュアル技術の反復を速く行えるかによっても決まるだろう。データを見ると、新しいレーダー会社がどんどん登録されていることがわかります。データによると、現在、我が国にはレーダー関連企業が 14,000 社あり、2020 年には 2,640 社が新規登録され、前年比 29.3% 増加しました。上場企業の河賽科技と大手ファーウェイが発表した低価格のライダー製品は、量産の準備が整っている。 供給側の成長傾向は、需要側の膨大な需要によって推進されています。スタートアップ企業から大企業まで、L3、L4の自動運転に取り組む企業のほとんどがLIDARを採用しており、自社で開発するのではなく購入している企業がほとんどです。 LiDAR ソリューションは、一時的にコストが高くなるにもかかわらず、高精度のハードウェア性能によってもたらされる安全上の利点により、市場に受け入れられる可能性があります。ほとんどのプレーヤーが LiDAR ソリューションを受け入れており、大きな需要が生まれています。生産能力もそれに応じて拡大し、大規模量産化が進んでいます。今後はスケールメリットによりコストがさらに削減され、好循環が生まれるでしょう。 10年以上の開発を経て、LIDARは高度な自動運転を実現するために不可欠なセンサーであることが証明されました。このような状況下で、テスラもそれを発展させると同時に、力を発揮し、人材を採用することに熱心です。以前、テスラがテストと開発にLIDARを使用するためにLIDAR技術企業ルミナーと契約を結んだというニュースは、皆の憶測を呼び起こした。テスラは後に、純粋な視覚ルートに固執することを明らかにしたが、ライダーを使用する意図を予測することは困難である。 純粋な視覚ルートをとれば、カメラは安価だが、その安全性には疑問がある。それはアルゴリズムと計算能力に関連しています。テスラは独自の膨大なデータとスーパーコンピューターに依存しており、これは誰にも真似できない強みです。これは、純粋な視覚ルートの方がはるかに先を行くか、互角になるかのどちらかであり、結果がどうであろうと、市場の他の企業は視覚認識ルートを追随することができないことを意味します。参加するスキルがなければ、ハラハラするゲームになるでしょう。 長期的には、コストと安全性の面から、2 つの視覚認識ルートは依然として議論の的となるでしょう。現在、LIDARの大規模開発のスピードとテスラの純粋視覚技術の開発スピードはまだ不明であるため、LIDARが最後に笑うことができるかどうかはわかりません。しかし現在、視覚認識技術の発展が未知数であるのに対し、LIDARソリューションはすでに大規模量産の道を歩んでおり、その明るい発展傾向は、この分野に笑顔で未来を迎える自信を与えている。 |
>>: 夢が叶う!火星への移住に備えて、スターシップは20年以内に火星に都市を建設する予定
雪梨、リンゴ、赤身の肉のスープは、熱と乾燥を取り除き、痰を解消し、咳を和らげるのに効果的です。特に女...
現代人にとって、オンライン配車サービスは徐々にタクシーに取って代わり、主な交通手段となってきました。...
最近、深セン・ワトマ電池有限公司(以下、ワトマ)の全従業員が7月1日から6か月間休暇を取るというニュ...
気温が上がるにつれて、「水をもっと飲む」ことが多くの人にとって健康の秘訣になってきました。少し前には...
目覚めて最初にすることは何ですか?先に食べてから歯を磨くべきでしょうか、それとも先に歯を磨いてから食...
バターとギーの違いは何でしょうか? まず、バターとは何か、バターはいつ使用するのか、そしてバターは人...
煮込んだ獅子頭は美味しくて、あらゆる年齢層に適した料理です。誰からも愛されています。しかし、自宅で作...
ウェッブ望遠鏡が地球近傍の水蒸気を持つ太陽系外惑星を発見地球から 26 光年離れた赤色矮星を周回する...
今日(1月26日)は旧暦12月24日であり、南部のほとんどの地域では「小正月」を祝っています。小正月...
社会の発展のペースが加速するにつれて、人々の生活のペースはますます緊張し、当然のことながらプレッシャ...
クラゲ皮とは何ですか?クラゲ皮はクラゲの完成品であり、クラゲは食用の大型クラゲの一種です。私の国では...
女性は美容とスキンケアのために蜂蜜水をもっと飲むべきだとよく聞きます。蜂蜜水の独特の効果は誰もが知っ...
新年が近づいてきました。中国の祭りとして、現代的な意味での元旦の「存在感」は、春節に比べてはるかに弱...
論語には「季節外れのものは食べてはいけない」とある。食事をする際には、季節に応じた食べ物の一貫性に注...
朝食は誰にとってもとても大切なものですが、多くの男性は朝食の重要性を無視しています。どんな仕事をして...