AIは写真がどこで撮影されたかを知ることができます

AIは写真がどこで撮影されたかを知ることができます

「こんにちは!明日は母の日です。私の母は約8年前に亡くなりました。私は幼かったので覚えていないので、この写真がどこで撮られたかわかるかわかりません。」画像クレジット: georainbolt

25歳のトレバー・レインボルトさんは、写真が撮影された地理的位置を特定する専門家として知られている。彼はネットユーザーから、古い写真が撮影された場所を探すのを手伝ってほしいという依頼を頻繁に受けます。彼は優れた判断力で多くの人々を助けました。

Ryanbolt さんは、写真を見て場所を推測するゲーム「GeoGuessr」のプロプレイヤーです。彼の人気により、このゲームを多くの人に知ってもらうことになりました。優れた結果は長期にわたるトレーニングと切り離せません。彼はこのゲームを1万時間以上プレイしており、流行中は1日4~8時間プレイできるという。

しかし、今年5月にAIに敗れた。

この驚くべき AI プレーヤーは、スタンフォード大学の大学院生 3 人によって約 2 か月で開発されました。トレーニング中、写真が撮影された国を 92% の確率で正しく推測し、GeoGuessr での平均スコアは 4525 (5000 点満点中) となり、世界中のプレイヤーの上位 0.01% にランクされました。

AI は時々満点に近づく |画像ソース: georainbolt

この AI 対戦相手に対して、ライアンボルトは敵わなかった。しかし、この AI がもたらすプライバシーリスクも、多くの人々に不安を与えています。

画像の位置を決める方法

Ryanbolt 氏と同様に、AI の 3 人の開発者も GeoGuessr のベテラン プレイヤーです。

GeoGuessr は、約 5,000 万人のプレイヤーが参加するオンライン地理推測ゲームで、2013 年にスウェーデンのソフトウェア エンジニアによって開発されました。ゲームに入ると、プレイヤーは Google ストリートビュー上のどこかにランダムに配置され、画面上の情報に基づいて自分の地理的位置を推測します。最後に、プレイヤーは世界地図上のどこかにピンを置いて、自分の推定位置をマークする必要があります。このゲームのプレイヤーのほとんどは非常に若く、最高のプレイヤーの中にはわずか 14 歳の人もいます。

ライアンボルトがAIと対戦した第1ラウンドで登場した画像、あなたも推測できます |画像ソース: georainbolt

プレイヤーの推測の正確さとスピードによってスコアが決まります。推測した位置が実際の位置に近いほど、プレイヤーが獲得するポイントが多くなります。さらに、推測をより早く完了したプレイヤーは、より高いスコアを獲得します。

第1ラウンドのスコア |画像ソース: georainbolt

ゲームによって提供される Google ストリートビュー画像の詳細は、プレイヤーの判断の基礎となります。地面の土、電柱、道路標識、道路標示、人々の衣服、植物、写真に写っている景観などの手がかりはすべて、場所を特定するために使用できます。もちろん、プレイヤー個人の直感も重要です。

審査のテクニックとしては、まず写真に写っているボラードや電柱に注目することをレインボルトは勧めています。これらは国や地域によってデザインが非常にユニークです。たとえば、デンマークのボラードの上部は黄色ですが、ドイツのボラードの上部は黒です。

例えば、電柱に使われる材質も特殊で、木製のものもあればコンクリート製のものもあります。電柱の形も異なり、電柱に貼られたステッカーも手がかりになります。 「オーストラリアのコンクリート柱の95%はビクトリア州にある」とレインボルト氏は語った。

プロのプレイヤーは複数の言語を学び、国によって異なる事柄を記憶します。例えば、どの国が三重の白線を使用しているか、どの国が点線の道路線を使用しているか、どの国が緑の道路標識を使用しているか、標識のフォントは何であるか、道路に使用されている建設資材、道路の長さ、道路上の車のナンバープレートと種類、道路の両側の植生の種類など...一見普通で小さな詳細はすべてゲームの手がかりになります。

写真の内容だけでなく、 Google ストリートビューで撮影された画像の品質にも違いがあります。サンマリノは世界最小の共和国で、イタリアに囲まれた国の中にある国であり、街の風景はイタリアのそれによく似ています。しかし、両者の画質は異なり、サンマリノの方が劣っています。

また、Google ストリートビューカーの一部が映ることもあります。ストリートビュー撮影車の上に黒いテープが貼ってある場合、その写真の場所は西アフリカの国、ガーナであることを意味します。

プレイヤーはヒントも共有しますが、Google ストリートビューの画像は 2,200 億枚以上あるため、すべてを覚えておくのは難しく、熟練したプレイヤーは直感に頼ることが多いです。

AI は人間のプレイヤーのような第六感を持っていませんが、人間が見ることができる明白な特徴を見ることができるだけでなく、人間が見落とすような細かい点にも注意を払うことができます。

AIが人間のプレイヤーに勝つ

昨年、スタンフォード大学の大学院生のグループが人工知能コース「ディープマルチタスクとメタ学習」を勉強していました。 GeoGuessr をプレイするのが大好きな 3 人の学生にはプロジェクトが必要だったので、共通の趣味から始めて、人間のプレイヤーよりも優れた人工知能プレイヤーを作成してみることにしました。

彼らのプロジェクトの名前は「画像の地理的位置の予測」であり、アルファベットの最初の文字をとって PIGEON と略されています。彼らは、OpenAI(ChatGPTの開発元でもある)が作成したCLIPニューラルネットワークを使用して、テキストを読み取って画像を理解・分析しました。次に、Google ストリートビューの画像を使用してシステムをトレーニングしました。トレーニング データセットには、約 500,000 枚の Google ストリート ビュー画像が含まれています。

AI は画像を非常に小さなブロックに分割して分析し、特殊なブロックを選択するのが非常に得意です。

しかし、AIにとって、写真は単なる画像ではなく、対応するテキスト情報も含まれています。画像内の建物、街路レイアウト、植生、ランドマークなどの視覚情報と、気象条件、季節、気候などのその他の補助情報を統合することで、AI はトッププレイヤーと同様に写真が撮影された場所を迅速に予測することもできます。

データセットのサイズが比較的小さいにもかかわらず、AI システムは最終的に非常に優れたパフォーマンスを発揮し、高い精度と人間の推測よりも低いエラー率を実現し、実際の位置から約 40 キロメートル以内の位置を特定することができました。 Ryanboltとの試合では、AIが多くのラウンドを簡単に勝ちました。

「我々はライアンボルトと戦った最初のAIではないが、ライアンボルトを倒した最初のAIだ」と、AIシステムの開発者の一人であるミハル・スクレタ氏は語った。

彼らは、修理が必要な道路や電線を特定したり、侵入植物を素早く見つけたりするなど、この技術のさまざまな潜在的な応用を考えている。今後の研究では、モデルをさらに改良し、測位精度を向上させる予定です。さらに、モデルの一般化能力(未知のデータや新しい状況に直面したときのモデルのパフォーマンス能力を指す)を向上させるために、地理位置情報データセットを拡張して、より多くの地理的領域と環境をカバーします。

起こりうるリスク

このアプリはすでに、ストリートビュー以外の写真の位置を特定できるようです。 「10年以上前のドライブ旅行で撮った写真を何枚か見せたら、ほとんどの場所を推測できた。約55キロ離れたイエローストーン公園のキャンプ場だと推測した。サンフランシスコの路上で撮った別の写真では、数ブロック先の場所だと推測した。専門家の間では懸念が出ている」とNPRの科学編集者、ジェフ・ブルムフィール氏は語った。

ますます強力になり、規制されていない AI に直面して、個人のプライバシーとセキュリティを保護することはますます困難になっているようです。プライバシーの観点から見ると、私たちの位置情報は非常に機密性の高い情報となる可能性があります。以前は、写真から GPS 位置タグを削除できましたが、現在はそれができない可能性があります。

低予算の学生プロジェクトにより、企業や大規模組織が一般人をスパイしたり、悪意のある人物が他人をストーカーしたり危害を加えたりすることが容易になる可能性がある。

AIに勝つことはできないので、ゲームを楽しむだけです。この写真はどこから来たと思いますか?

参考文献

[1] Haas, L.、Alberti, S.、および Skreta, M. (2023)。 PIGEON: 画像の地理的位置を予測します。リサーチゲート。 https://www.researchgate.net/publication/372313510_PIGEON_Predicting_Image_Geolocations から取得

[2] ブルムフィールド、G.(2023)。人工知能は写真からあなたの位置を特定できるため、プライバシーの専門家は懸念している。 NPR。 https://www.npr.org/transcripts/1219984002 から取得

[3] ジョーンズ,R.(2023)。地球上のどこかの Google ストリートビュー画像が与えられたら、その場所を特定できますか?ガーディアン。 https://www.theguardian.com/lifeandstyle/2023/dec/23/geoguessr-world-championships-2023-inside-story より取得

[4] レインボルト(2023年5月11日)。世界最高の AI 対 geoguessr pro。ユーチューブ。 https://www.youtube.com/watch?v=ts5lPDV--cU から取得

[5] 有線。 (2022年8月31日)。プロの GeoGuessr プレイヤーが勝つために使用するすべてのトリック (RAINBOLT 出演) |有線。ユーチューブ。 https://www.youtube.com/watch?v=0p5Eb4OSZCs から取得

[6] ロイド、A.(2022)。 Rainbolt: 位置追跡で話題になっているTikTokユーザーのGeoGuessr。インサイダー。 https://www.insider.com/trevor-rainbolt-geoguessr-tiktoker-location-tracking-interview-2022-11 から取得

企画・制作

出典: Bringing Science Home (id: steamforkids)

著者 |クラウドマガジン編集者

編集者:王夢如

<<:  複数の衛星を宇宙に打ち上げる競争によってロケットの共有を実現するにはどうすればよいでしょうか?

>>:  サイズは小さいですが、価格は数倍高くなります!ミニ野菜はお金の無駄でしょうか?

推薦する

春節の時期に車で帰宅する人は、高速道路の「モバイルキラー」に注意してください

少し前に、新鄭黄河大橋(国道107号線)で多重車両連鎖衝突事故が発生しました。多くの車両が橋の上で衝...

ネギパンケーキの作り方

多くの人はネギパンケーキに特別な思い入れを持っています。なぜなら、それは故郷の味だからです。北部の人...

アリババミュージックと世界クラスの音楽組織の間に立ちはだかるのは、高小松だけだろうか?

人事異動のニュースは、オンライン音楽業界が大きな産業変革の先駆けとなる可能性があることを示唆している...

53人が死亡しました!危機的な瞬間にあなたの命を救うことができる知識!知っておくべき重要なこと…

この記事の専門家:ハルビン森林消防隊副隊長、消防救助指揮部長、劉永佳決して放棄しない、決して諦めない...

ウィートグラスの食べ方

ウィートグラスを正しく食べるには?まずウィートグラスとは何かを理解しましょう。ウィートグラスは植物の...

酢の選び方は?酢には本当に栄養がたっぷり含まれているのでしょうか?

以前、友人と醤油の選び方について話したことがあります。私は彼らに、アミノ酸窒素とナトリウム含有量とい...

ベジタリアンであることのデメリット

最近、人々は健康にますます注意を払うようになり、ベジタリアン食にもますます注意を払うようになりました...

秋のお腹を養うおいしいシチュー7選

寒くなると、さまざまな軽い病気や痛みも出てきます。この季節に最もダメージを受けるのは胃腸です。気を付...

皮膚アレルギーがある場合、松の実を食べても大丈夫ですか?

皮膚アレルギーは一般的な皮膚疾患であり、アレルギーの一般的な形態でもあります。アレルギーが起こると、...

ファラデーの元クリエイティブディレクターがアストンマーティンの最高技術責任者に任命

海外メディアの報道によると、アストンマーティンは最近、マクシミリアン・スヴァイを新たな最高技術責任者...

炭酸水を飲むのが大好きな人たちに何が起こったのでしょうか?

近年、炭酸水の人気が高まり、多くの人にとって生活必需品となっています。スパークリングウォーターは、味...

「紅炎少女」の人気はスポーツ分裂時代の縮図

このオリンピックは少々退屈で、テレビから去った視聴者は例年ほど金メダルのリストに関心がなかった。幸い...

ビワは中国産ですか、それとも日本産ですか?咳を和らげることはできますか?

「ビワ」という言葉は、スーパーマーケットの値札よりも、「○○ビワ咳止めシロップ」などの薬の名前でよ...

牛の脳の栄養価

牛脳とは牛の脳のことを指します。牛脳は食べることができます。牛脳の揚げ物や煮込みなど、とても美味しい...