人工知能と膨大なデータにより、テクノロジーの巨人が追い抜くのは困難になっている

人工知能と膨大なデータにより、テクノロジーの巨人が追い抜くのは困難になっている

テクノロジー業界では、永遠に存続する「100 年の歴史を持つ店舗」はこれまで存在したことがない。例えば、インターネット時代において、かつて携帯電話市場で強大な力を持っていたノキアが、やがて衰退し、市場から撤退するとは誰も考えなかったでしょう。 AI時代の到来とともに、テクノロジー大手は時代に淘汰されるのを避けるために、自社の開発ボトルネックを打破しようと、内部でイノベーションを起こし始めました。 AI分野で成功したいなら、データは欠かせない基本要素です。データを所有すれば未来を所有できる、という格言があります。それは本当ですか?

今週初め、Google は人工知能の研究レポートを発表しましたが、その結果は現在の AI ブームにおける重要なビジネス動向を思い起こさせてくれました。消費者と経済は、テクノロジー企業のエコシステムにますます依存するようになっている。テクノロジー企業のエコシステムは、長い間、内部の混乱を通じて革新的で非独占的であり続け、その過程で中小企業が大企業を混乱させることを可能にしてきたと考えられてきた。しかし、テクノロジー競争が大量のデータに基づく機械学習システムに依存するようになると、テクノロジー大手を上回るのはこれまで以上に難しくなるかもしれない。

グーグルは月曜日、カーネギーメロン大学(CMU)との「高額な」共同研究について説明した新たなプレプリント論文を発表した。彼らの画像認識実験では、50 個の強力なグラフィック プロセッサを統合するのに 2 か月かかり、前例のない 3 億枚のラベル付き画像セットが使用されました (画像認識の多くの取り組みでは、わずか 100 万枚の画像の標準セットが使用されています)。このプロジェクトの目的は、既存のアルゴリズムを微調整するのではなく、より多くのデータを提供することで、より正確な画像認識を実現できるかどうかをテストすることです。

答えはイエスです。 Google と CMU の研究者が新しいデータセットを使用して標準的な画像処理システムをトレーニングしたところ、写真内の物体の検出など、ソフトウェアが画像を解釈する方法を判定するいくつかの標準的なテストで、最先端の結果が得られたことがわかりました。抽出されたデータの量と画像認識アルゴリズムによって実証された精度の間には明確な相関関係がありました。この発見は、人工知能研究で広まっている疑問「既存のアルゴリズムにさらにデータを入力することで、より多くのデータを引き出せるかどうか」を解明するのに役立つ。

この実験は、膨大な量のデータを持つことはより大きな力を持つこととほぼ等しいことを示し、それはまた、Google、Facebook、Microsoftなどの膨大な量のデータを持つテクノロジー大手が、以前よりも大きな利益を得る可能性があることを意味している。しかし、Google の膨大な 3 億枚の画像データセットでは大きなメリットは得られません。画像を 100 万枚から 3 億枚に増やしても、物体検出スコアは 3 パーセントポイントしか上がりません。しかし、論文の著者らは、ソフトウェアを微調整して非常に大規模なデータセットに適したものにすることで、その利点を拡大できると考えている。たとえそうではないことが判明したとしても、テクノロジー業界では、どんなに小さな利点でも重要です。たとえば、自動運転車の視覚精度を少しでも向上させるのは極めて重要であり、数十億ドルの収益を生み出す可能性のある製品の場合、効率性の向上は極めて大きなものになります。

AI中心の企業にとって、データの収集は防御戦略となっています。 Google、Microsoft、その他の企業は、多くのソフトウェア、さらにはハードウェアの設計をオープンソース化していますが、それらのツールを動作させるデータはほとんどオープンソース化されていません。

Leifeng.comによると、GoogleはオープンソースのTensorFlow AIエンジンを発表した際、AIの真の価値はソフトウェアやアルゴリズムではなく、AIをよりインテリジェントにするために必要なデータにあると述べた。 Google は他のコンテンツを放棄するかもしれないが、少なくとも今のところはデータは確実に保持するだろう。

しかし、テクノロジー大手は一部のデータを公開しています。昨年、Google は 700 万本を超える YouTube 動画の膨大なデータセットを公開し、Salesforce はアルゴリズムによる言語分析を支援するために Wikipedia を公開しました。しかし、AI開発研究所マニフォールドのパートナーであり、ローレンス・バークレー国立研究所の客員研究員でもあるルーク・デ・オリベイラ氏は、こうしたオープン性は潜在的な競争相手にとってあまり価値をもたらさないことが多いと語る。 「こうしたデータセットは、製品が市場での地位を維持する上で決して重要ではなかった」と彼は語った。

クラウド コンピューティングの普及により、Amazon や Microsoft などの企業はインターネットの膨大な処理能力を利用できるようになりました。しかし、最も豊富なデータは依然としてGoogleやFacebookなどの大企業の手に握られており、テキストから画像、動画から音声までの豊富なコミュニケーション情報を含むこれらのサービスの利用者は数十億人近くに上ります。彼らは皆、強力な AI ソフトウェアの構築に取り組んでいますが、彼らの真の競争上の優位性は、ソフトウェアに人間のように考えるように教えるために使用できる、大量の高品質データにあります。

Google と CMU の研究者は、処理した貴重なデータを使って、最新の研究をより「Google 規模」のオープン画像データセットの作成に役立てたいと述べた。 「ビジョンコミュニティがデータの価値を過小評価せず、共同の努力を通じてより大きなデータセットを構築できることを心から願っています」と彼らは書いている。この研究を率いたアビナフ・グプタ氏は、選択肢の一つは、FacebookとMicrosoftが設立し、画像データセットを公開している非営利団体、Common Visual Data Foundationと協力することだと考えている。

同時に、データの乏しい企業は、自社のアルゴリズムをより賢くしたいと考える、データが豊富な大企業に圧迫されている世界で生き残りたいのであれば、創造性を発揮する必要があるだろう。 DataRobot の CEO である Jeremy Achin 氏は、保険業界など多くの企業や業界で機械学習の重要性が増すにつれ、小規模企業が収集したデータによってリスク予測で大企業と競争できるようになるため、このモデルが広く普及する可能性があると推測しています。

この進歩により、機械学習がデータ不足から解放され、AI のデータ経済に革命が起こる可能性があります。昨年、Uber はこの目的で AI 企業を買収したが、今度は AI 実践者のデータ優位性を回避しようとする可能性もある。機械学習の利用可能性を高めることに専念する企業 Fast.ai の共同設立者、レイチェル・トーマス氏は、スタートアップ企業はインターネット大手が手を付けることすらできない分野 (農業など) に機械学習を適用できることが多いと考えています。 「これらの大企業があらゆる分野で大きな優位性を持っているとは思えないが、現時点では誰もデータを収集していない特定の分野はたくさんある」と彼女は語った。人工知能分野の巨人にも盲点はあります。

出典: Leifeng.com、Wierdより編集

<<:  米国の専門家:真の自動運転車は2075年まで利用できない

>>:  2030年の実現:人間と機械の協働の新時代

推薦する

ハネカクシの毒は硫酸に匹敵しますか?実際、これらのバグについてはもっと注意する必要があります。

夏の外出時には、さまざまな種類の昆虫に遭遇することは避けられず、能動的または受動的に人々に危害を与え...

卵と豆乳は同時に食べてもいいですか?

卵と豆乳は、朝食に欠かせないおいしい食べ物です。これらは、私たちの体に必要なさまざまな栄養素を補給す...

睡眠を促進する食品

食べ物は非常に一般的であり、異なる食べ物は人体に異なる影響を及ぼします。したがって、食べ物を選ぶとき...

Omdia: マイクロソフトは2024年に485,000個のNvidia Hopperチップを購入し、世界最大のGPU購入者になる

マイクロソフトは2024年に世界最大のNVIDIA GPU購入者となる。総購入額は約50万元で、全競...

誰が紳士で誰が悪人なのか?孔子は3つの文ですべてを言いました!

混合知識混乱を治すために特別に設計されています!...

Toutiao の価値は 100 億ドルですか?

最近、今日頭条の「価値観」について多くの議論がなされているが、そのコメントのほとんどは道徳的な観点か...

杭州ハードサイエンス研究所 | 「バックパック」だけで3Dマップを構築!

レーダー、通信、ナビゲーション、アンテナ、光エレクトロニクス…これらの高精度、高性能の複合電子機器の...

今夏のインフルエンザ、感染しないために「己を知り敵を知る」方法

最近、南部の一部省でインフルエンザ検査の陽性率が上昇を続けており、福建省、広東省、海南省、江西省など...

豚皮の煮込みの準備

実は、煮込み料理は味が良いだけでなく、栄養価も高いので、多くの人が大好き。煮込み豚の頭皮は、多くの人...

人間のように描く、GTチームがグラフィティロボットシステムを開発

ジョージア工科大学の研究チームは、人間の動きの滑らかさを模倣できる初の落書きロボットシステムを構築し...

痛風の人はスイカを食べても大丈夫ですか?

スイカは実生活でよく食べられる果物の一種です。その栄養価にはビタミンの含有量が含まれます。すべての果...

特殊小麦粉の栄養価

名前の通り、スペシャルフラワーは最高の小麦粉です。一般的には特上小麦粉と呼ばれています。小麦の一番良...

牛ブリスケットスープのレシピ

牛のブリスケットは、牛の中でもとても美味しい部位です。私たちは、牛のブリスケットを使って、多くの美味...

豚肉のデンプンのカロリー

日常生活では豚肉をよく食べますが、ある程度、豚は私たちの友達であり、特に田舎の友達にとっては友達です...

李嗣光:彼の光は広く広まり、国のために大いに役立った

李嗣光は1889年10月に湖北省黄岡市で生まれました。彼は我が国の有名な地質学者、教育者、社会活動家...