数日前、「億万長者が25年間行方不明だった息子を発見」という話題がインターネット全体の注目を集めた。 1998年、生後わずか3か月だった謝清帥が誘拐された。父親は捜索を続け、ついに25年後に父と息子は再会した。 今回、謝清帥の家族の再会は顔認識を行う企業と切り離せないものだった。同社の「異年齢同族顔照合アルゴリズム」は、杰青帥の両親と兄弟の顔画像を分析して照合し、最終的にDNA比較によって杰青帥の身元を確認した。 画像出典: Sina Weibo のスクリーンショット 問題は、Jie Qingshuai の顔認識技術の探求とは何なのかということです。これは携帯電話のロックを解除するのに使用するのと同じ技術ですか?今日は顔認識の過去と現在についてお話ししましょう。 手動支援から純粋なコンピュータ認識へ 1. 身体的特徴で人を定義する 1879年、フランスの犯罪学者アルフォンス・ベルティヨンは、犯罪者や容疑者を識別する方法を発明しました。肘から中指の先までの長さ、右耳の長さ、左足の長さなど、11の身体データを測定して人物を識別するという方法です。 アルフォンスの人間の特徴を識別する方法、画像出典: wikimedia アルフォンスの当初の目的は悪人を識別することでしたが、身体的なデータ特性に基づいて人物を識別するという彼のアイデアは、その後の顔認識技術に大きなインスピレーションを与えました。 2. 「半自動」顔認識 1964年、アメリカの数学者で人工知能の専門家であるウッディ・ブレッドソーらは、コンピューターを使って人物の写真を認識する試みを始めました。当初のアイデアは、さまざまな角度から人の顔の写真を撮り、その写真の明暗のデータをコンピューターに学習させて顔を認識するというものでした。しかし、当時の技術的な制限を考慮すると、このアイデアはまったく機能しませんでした。 最終的にウッディらはアルフォンスと同様の方法を選択し、目の幅や間隔、耳の長さ、口角の長さなど、人間の顔にある約20の特徴を探し、これらの特徴の値を計測して人物を定義するというものでした。 しかし、当時のコンピューターでは写真から直接これらのデータを測定することができなかったため、ウッディは測定データを手動でコンピューターに入力する必要があるソフトウェアを設計する必要がありました。その後、コンピューターはそれらをデータベースのデータと比較し、その顔が誰のものかを識別しました。 これは最も初期の顔認識ソフトウェアとみなすことができますが、人間の関与を必要とする「半自動」方式であり、1 時間あたり 40 枚の写真しか処理できません。 3完全自動顔認識 1970年代に、日本の科学者である金出武雄氏が新しい顔認識ソフトウェアを実演しました。このソフトウェアは、顎の位置を自動的に特定し、顔データを自動的に測定して認識を自動的に実行できます。 このソフトウェアは、依然として撮影角度、光と影などの要素の影響を受け、認識精度には限界がありますが、「半自動」から「全自動」への重要な移行を実現しました。 1980 年代から 1990 年代にかけて、Eigenfaces や Fisherfaces などの手法の登場により、完全自動顔認識技術が大きく進歩し、制御された環境における静止写真 (ID 写真など) の認識能力が比較的信頼できるものになりました。 例えば、米国のウェストバージニア州とニューメキシコ州では、同一人物が異なる名前で複数の運転免許証を申請することを防ぐため、運転免許証上の顔を識別する顔認識技術を導入している。 1997年、米国ミネソタ州も州内の犯罪者を識別するために顔認識システムを使い始めました。 4 畳み込みニューラルネットワークが飛躍をもたらす 2010年頃、畳み込みニューラルネットワークに基づくディープラーニング技術が顔認識技術に新たな飛躍をもたらしました。 畳み込みニューラル ネットワークは、生物の視覚を模倣したニューラル ネットワークの一種であり、そのアーキテクチャは画像情報の処理に非常に適しています。人は畳み込みニューラルネットワークに基づいてさまざまな最適化を行い、必要に応じて明暗や線の輪郭など、画像上のさまざまな種類の情報を抽出して、画像を総合的に判断することができます。 顔認識システム。画像出典:参考文献[2] この方法は、アルフォンスの以前の方法とは多少異なります。目の幅や耳の長さなどの特定の数値に基づいて顔を認識するのではなく、顔全体の特徴に基づいて顔を直接認識します。これは、動物の視覚の認識プロセスに似ています。 2010 年頃、Fei-Fei Li らが構築した、手動で注釈が付けられた数千万枚の画像を含む ImageNet など、ディープ ニューラル ネットワークをトレーニングできるコンピューター ビジョン データベースがますます高度化しました。さらに、2012年頃からはディープラーニングの分野にもGPUが応用され、顔認識技術の速度と精度が大幅に向上しました。 例えば、2014年にFaceBookのDeepFace顔認識システムは、人間の認識精度とほぼ同じ97.35%の精度を達成しました。 2015年にGoogleが提案したFaceNetは、一部のデータベースで顔認識精度が99.63%に達しています。 Deepface顔認識システム、画像出典:参考文献[3] 今日に至るまで、顔認識技術は急速に発展し続けています。静止した写真を認識できるだけでなく、ビデオ画像内の動的な顔も正確かつ迅速に認識できます。 ユビキタス顔認識技術 顔認識の精度が高まるにつれて、生活におけるその応用も増えています。 たとえば、現在では主流の携帯電話のほとんどが顔認証によるロック解除をサポートしています。多くのコンビニエンスストアで買い物をするとき、支払いコードを開くために携帯電話を取り出す必要はなく、顔認識で支払うことができます。駅の出入りの際には、顔をスキャンするだけでゲートを通過することもできます。 これらの日常的な用途に加えて、顔認識システムはいくつかの特殊な分野でも重要な役割を果たします。 例えば、2018年4月以来、ジャッキー・チュンのコンサートでは、防犯カメラや監視カメラが100人近くの逃亡者や犯罪容疑者を捕らえることに成功しており、ネットユーザーの間ではジャッキー・チュンのコンサートは単なる「逮捕集会」だと冗談を飛ばしている。 また、社会的に大きな論争を巻き起こした老鎔基事件では、顔認識システムが23年間逃亡を続けていた老鎔基を容易に特定した。 出典:厦門警察のビデオのスクリーンショット 年齢を超えた顔認識や、顔が隠れている状態での顔認識など、顔認識技術の精度がますます高まるにつれ、顔認識技術は私たちの安全をよりよく守ることができるようになります。 前述の「異年齢・同族顔比較アルゴリズム」も、特定分野における顔認識技術の最適化です。この機能は、何年も経ってから逃亡中の容疑者を見つけるのに役立つだけでなく、行方不明になったり誘拐されたりした子供が実の親を見つけるのにも大いに役立ちます。 親族関係に基づいた顔認識システム。画像出典:参考文献[4] AI 顔認識は私たちの生活に利便性をもたらし、安全を守ってくれる一方で、いくつかのリスクもあることに注意する必要があります。 たとえば、携帯電話の一部のアプリは顔データを使用しています。ほとんどの企業はこうしたデータのセキュリティを確保するために最善を尽くしますが、データセキュリティをまったく保護できない、または保護する意図がないソフトウェア開発者も依然として存在し、深刻な個人情報漏洩を引き起こす可能性があります。 たとえば、米国の法執行機関にサービスを提供している ClearviewAI 社は、かつてデータ漏洩の被害に遭いました。さらに同社は、ユーザーの同意なくアルゴリズムのトレーニング用にユーザーの写真情報を違法に収集していたことも暴露された。 つまり、顔認識技術は半世紀以上の歴史を持っていますが、急速な発展段階に入り、生活のあらゆる分野に浸透したのはここ10年ほどのことです。 顔認識技術が適切な場所で使用されれば、私たちの生活に利便性と安全性がもたらされ、長年離れ離れになっていた家族が再会できるようになります。 しかし、技術の発展による利便性を享受する一方で、プライバシーに対する意識を高め、情報漏洩の可能性を減らすために、自分の写真や動画を知らないミニプログラムで使わないようにしなければなりません。 参考文献 [1]AdjabiI、OuahabiA、BenzaouiA、etal.過去、現在、そして未来のオフィス認識:レビュー[J]。エレクトロニクス、2020、9(8):1188。 [2] 王良、黄永振、張開豪。畳み込みニューラルネットワークに基づく顔の親族関係認識の方法および装置、CN105005774A、2019-02-19 [3]TaigmanY、YangM、RanzatoMA、etal.Deepface:顔認証における人間レベルのパフォーマンスとのギャップを埋める[C]//ProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition.2014:1701-1708. [4]RobinsonJP、ShaoM、WuY、etal.Familiesinthewild(fiw):Large-scalekinshipimagedatabaseandbenchmarks[C]//Proceedingsofthe24thACMinternationalconferenceonMultimedia.ACM、2016:242-246 この記事は科学普及中国-星空プロジェクトの作品です 制作:中国科学技術協会科学普及部 制作|中国科学技術出版有限公司、北京中科星和文化メディア有限公司 著者: サイエンススクラップス ポピュラーサイエンス制作チーム レビュー丨テンセント玄武ラボの責任者、Yu Yang氏 |
<<: 地下2,400メートルの国内最重要設備が稼働開始!なぜ世界最深・最大の地下深部実験室が金平にあるのでしょうか?
>>: このペースを維持できますか?糖尿病リスクは39%低下する可能性→
世の中の物質はさまざまな形で現れます。物質には、固体、液体、気体、プラズマ、ボーズ・アインシュタイン...
このほど、江蘇省淮安市で、シノケムインターナショナル(600500.SH)、南京博俊新能源汽車有限公...
4月も中旬になり、暖かかったり寒かったりの季節も終わりに近づいてきました。春の最後の節気である穀雨...
唐代の銀製チェス盤。国立海洋博物館の中国海洋文明第一章展示ホールに所蔵されている。チェス盤は13cm...
古代から現代に至るまで、アイススケートからスキーまで、人々は冬のスポーツの探求をやめたことはありませ...
自動運転技術が自動車業界に大きな変化をもたらすことは私たちにとって周知の事実です。しかし、それはまた...
食品サプリメントは健康を維持する最良の方法であることはよく知られています。特に冬場は、毎日の食事に注...
生活水準の継続的な向上に伴い、人々の体も大きな変化を遂げています。食事の節制がないため、体に多くの問...
電子レンジ加熱原理:電子レンジは食品を内側から加熱します。マイクロ波を放射し、食品内の分子(主に水分...
月餅は中国において深い文化的歴史を持っています。その丸い形は常に中国の再会を象徴しています。古代中国...
涼皮は小麦粉と澱粉で作られており、冷たい食べ物なので夏に食べるのに適しています。小麦粉を使った食べ物...
どのテクノロジー企業にも独自のイメージがあります。 Google と言えば、人々はデータを思い浮かべ...
(担当編集:ハン・メンリン)...