ウィキメディア財団:AIクローラーによりウィキメディア・コモンズの帯域幅需要が50%増加

ウィキメディア財団:AIクローラーによりウィキメディア・コモンズの帯域幅需要が50%増加

ウィキペディアやその他十数件のクラウドソーシング知識プロジェクトの管理組織であるウィキメディア財団は月曜日、ウィキメディア・コモンズからマルチメディアをダウンロードするための帯域幅消費が2024年1月以来50%急増したと発表した。

同社は火曜日のブログ投稿で、その理由は知識欲の強い人間からの需要増加によるものではなく、人工知能モデルを訓練したい自動化されたデータ欲の強いクローラーによるものだと述べている。

「当社のインフラは、注目度の高いイベントの際に人間によるトラフィックの急増に耐えられるように構築されていますが、ボットによって生成されるトラフィックの量は前例のないほど多く、リスクとコストの増加を伴います」と投稿には書かれている。

Wikimedia Commons は、オープン ライセンスまたはパブリック ドメインで利用できる画像、ビデオ、オーディオ ファイルの、自由にアクセスできるリポジトリです。

さらに詳しく調べてみると、Wikipedia によると、最も「高価な」トラフィック、つまり消費されるコンテンツの種類に関して最もリソースを消費するトラフィックのほぼ 3 分の 2 (65%) がボットから来ているそうです。しかし、全体のページビューのうち、これらのボットから得られたものはわずか 35% でした。 Wikipedia によると、この違いの理由は、頻繁にアクセスされるコンテンツはユーザーに近いキャッシュに保存されるのに対し、あまりアクセスされないコンテンツは遠く離れた「コア データ センター」に保存され、コンテンツの提供にはより多くのコストがかかるためです。これはボットが通常探すコンテンツの種類です。

「人間の読者は特定の(多くの場合は類似した)トピックに焦点を当てる傾向があるのに対し、クローラーボットは大量のページを「一括読み取り」し、あまり人気のないページを訪問する傾向がある」とWikipediaは書いている。 「つまり、こうしたタイプのリクエストはコアデータセンターに転送される可能性が高くなり、リソースの消費コストが高くなります。」

全体として、ウィキメディア財団のサイト信頼性チームは、一般ユーザーへの混乱を避けるためにボットをブロックするために多くの時間とリソースを費やす必要があります。そして、これはすべて、財団が直面するクラウド コストを考慮する前の話です。

実際、これはオープン インターネットの存在そのものを脅かす、急速に拡大している傾向の一部を表しています。先月、ソフトウェアエンジニアでありオープンソースの支持者であるドリュー・デボールト氏は、AIクローラーが自動トラフィックから保護するために設計された「robots.txt」ファイルを無視していると不満を述べた。また、「実践的なエンジニア」のゲルゲリー・オロス氏も先週、Meta などの企業の AI クローラーが自身のプロジェクトの帯域幅需要を増大させていると不満を漏らした。

オープンソースのインフラが特に最前線にある一方で、開発者たちは「創意工夫と復讐心」で反撃している。一部のテクノロジー企業もこの問題の解決に取り組んでいる。たとえば、Cloudflare は最近、AI 生成コンテンツを使用してクローラーの速度を低下させる AI Labyrinth を立ち上げた。

しかし、これはむしろ猫とネズミのゲームであり、最終的には多くの出版社がログインとペイウォールの背後に隠れざるを得なくなる可能性があり、それは今日ウェブを使用しているすべての人にとって有害となるでしょう。

中国産業情報ステーションより

<<:  エキサイティングなエンターテイメントを探索してください。Huawei VR Glass メガネがあなたに本当の楽しい体験をもたらします!

>>:  iQOO 5レビュー:あらゆる面でバランスのとれた進化、史上初の「軽量」ゲーミングスマホ

推薦する

Meizu Note 2ハンズオン:細部が大きな違いを生む

Meizuはハードウェアにほとんど変更のないMeizu Blue Note 2を発表し、記者会見全体...

国産の中型SUVが隆盛を極める時代に、Tiggo 8はCheryが確固たる地位を築くのに役立つだろうか?

GAC Trumpchi GS8の成功後、ますます多くの国内ブランドが中型SUV市場に注力し、躍進...

銀河の人口調査をしてるんですか?中国の「スカイサーベイ」が「ハッブル危機」の解決に貢献!

中国科学誌「サイエンス中国物理・機械・天文学(SCPMA)」の英語版は、2024年第3号の表紙記事と...

黒もち米と黒米の違い

多くの友人は、黒米は黒いもち米だと思っており、その違いはわかりません。しかし、私たちが伝えたいのは、...

数十ドルの日焼け止め服と数百ドルの日焼け止め服の違いはどれくらい大きいのでしょうか?観た後はお金を無駄にしないでください!

秋の始まりとはいえ、太陽の紫外線の強さはまだまだ強いです。また、人々の日常の服装は主に半袖、ショート...

虫垂、親知らず、尾骨...なぜ人間には奇妙な進化の名残が常に残っているのでしょうか?

© ゲッティイメージズリヴァイアサンプレス:乳首が余っている人が多いと言われています。これはおかし...

年齢によって食べるおやつは異なる

肌の状態はそれぞれ異なるため、年齢層ごとにスキンケアの重点が異なります。女性は美容やスキンケアで何に...

赤ワインの飲み方

赤ワインを飲むと人生に感謝することができます。赤ワインは人生に感謝するための最も代表的なものと言えま...

大根の細切りの漬け方

中国の数千年の歴史と文化の中で、漬物文化が人々の食文化の中で重要な位置を占めていることがわかります。...

フォルクスワーゲンの幹部は不正行為に対する補償額を知っていた可能性があり、投資家にタイムリーに通知しなかった疑いがある。

ドイツのビルト・アム・ゾンターク紙によると、以前マイアミで逮捕されたフォルクスワーゲンのマネージャー...

AIによる絵画の登場で画家たちは職を失うのでしょうか?

少し前、AI絵画「スペースオペラ」が芸術コンテストのデジタルアート部門で優勝したことがWeiboで話...

クレソンの効能と機能

クレソンは、クレソンなど多くの別名を持つ緑色の野菜です。クレソンなど一般的なクレソンのほとんどは広東...

AlphaGoの背後にあるディープラーニング技術についての簡単な説明

はじめに: Alfa Go に関する解説記事は数多くありますが、実際に開発チームとコミュニケーション...

シンプルで美味しい家庭料理

オフィスワーカーにとって、時間こそが最も貴重なものです。私は毎日仕事で忙しく、その後家に帰って子供の...