顔認識についてどれくらい知っていますか?

顔認識についてどれくらい知っていますか?

近年、人工知能技術の急速な発展に伴い、顔認証は人々の日常生活に溶け込みつつあり、顔をスワイプして支払いをしたり、顔をスワイプして電話をオンにしたり、顔をスワイプしてパスしたりするなど、人々の生活習慣を静かに変えつつあります。では、機械はどのようにしてこれが人間であると認識するのでしょうか?所有者が誰であるかをどうやって識別するのでしょうか?次に、この「ブラックテクノロジー」の背後にある謎を一緒に探って解明しましょう。

顔認識技術の概要

顔認識技術は生体認証技術の一種です。人の顔の特定の特徴(目、鼻、口、眉毛など)に基づいて、自動的に人物を識別する技術です。顔認識、肖像認識、容姿認識、顔認識などとも呼ばれます。主にカメラやビデオカメラを使用して顔が含まれる画像やビデオストリームを収集し、顔検出技術を使用して顔があるかどうかを分析します。そうであれば、顔の位置、大きさ、主要な顔の器官の位置に関する情報が得られます。次に、この情報に含まれる識別特徴を抽出し、既知の顔の特徴と比較して、各顔の識別を行います。

顔検出

顔検出は、顔認識および顔分析システムにおける最初の重要なステップです。これは主に、「顔はどこにあるのか」という問題を解決し、画像内の顔の位置とサイズを正確に調整し、その後の顔の特徴分析と認識に提供するために使用されます。初期の顔検出作業は主に手動で設計されたローカル記述子に基づく特徴抽出に基づいており、知識ベースの顔検出方法、モデルベースの顔検出方法、特徴ベースの顔検出方法、外観ベースの顔検出方法の 4 つのカテゴリに分けられます。その中でも、より古典的な研究としては、ハールカスケード分類器や HOG (Histogram of Oriented Gridients) 特徴検出アルゴリズムなどがあります。しかし、従来の検出では、複数の変動要因がある難しい画像に対する顔検出の精度が限られています。

図 WIDER FACE: 顔検出ベンチマーク

ディープラーニングの活発な発展に伴い、さまざまなディープラーニングアーキテクチャに基づく多くの顔検出方法が徐々に進化してきました。主に、カスケードCNNモデル、R-CNNモデル、シングルショット検出器モデル、特徴ピラミッドネットワークモデル、トランスフォーマーモデルなどが含まれており、従来の顔検出と認識の特徴抽出、精度、スケーラビリティが大幅に向上しました。 MTCNN は優れた顔検出モデルの 1 つです。このモデルは、3 段階の深層畳み込みネットワークを通じて、顔とランドマークの位置を大まかから細かく予測します。具体的な手順は次のとおりです。ステージ 1: 浅い CNN を使用して候補ウィンドウをすばやく生成します。ステージ 2: より複雑な CNN を使用して、多数の顔以外のウィンドウを拒否することでウィンドウを改良します。ステージ 3: より強力な CNN を使用して結果を再度調整し、5 つの顔のランドマークの位置を出力します。

顔の特徴

顔の特徴は、顔の表現とも呼ばれ、顔の長さ、顔の幅、唇の幅、鼻の長さなど、顔の特定の特徴です。顔の特徴抽出は、顔の特徴をモデル化してベクトル化された顔の特徴を取得するプロセスです。顔の特徴抽出は、その技術的特徴によって、大域情報に基づく全体論的手法、局所情報に基づく局所的特徴手法、ディープラーニングに基づく手法の 3 つに大別できます。ディープラーニングに基づく顔の特徴は、データセットから特徴を自動的に学習できます。データ セットが十分に堅牢なデータ (照明、姿勢、表情など) をカバーできる場合、アルゴリズムはさまざまな課題に適応できます。これは現在主流の顔の特徴抽出方法でもあります。

顔認識

顔認識は顔を比較するプロセスです。抽出された顔の特徴を比較することで、2 つの顔の類似性が得られます。判定方法は、2つの特徴間のユークリッド距離(L2距離)またはコサイン距離(コサイン距離)を比較することです。L2距離が小さいほど、類似性が高くなります。コサイン距離角度が小さいほど、コサイン距離が大きいほど、類似度が高くなります。アライメント数に応じて、1:1 と 1:N に分けられます。最も一般的な 1:1 シナリオは、高速鉄道に乗るときに遭遇する機器などの人物と文書のマッチングです。 1:N は、1 つの顔をデータベース内の N 個の顔と比較することを意味します。例えば、出勤簿機の顔データベースには、会社全体の顔写真がすべて保存されています。

著者: 金建超

部署:中国移動スマートホームオペレーションセンター

<<:  他人のために 50 万人の赤ちゃんを育てて、その後で返さなければならないなんて、一体どういうことなのでしょう?

>>:  スターシップの打ち上げは失敗したが、宇宙飛行の次の時代が到来する

推薦する

Xiaomiの人員削減は理解できるが予想外

年末が近づく中、Xiaomi は人員削減を発表した。最近、一部のメディアは、Xiaomi が新たな一...

Meizu Blue 6Tレビュー:799元で買える優れたデュアルカメラ製品

100元バケツスマホを再定義するMeizu Blue 6Tレビューかつて、Meizu は「永遠の M...

お茶うずら卵の作り方

ウズラの卵は実は安全です。私たちは日常生活で頻繁に食べることはないかもしれませんが、実は鶏卵やアヒル...

宇宙飛行士が月に戻るには、いくつの困難を乗り越えなければならないのでしょうか?

宇宙航空研究開発機構は今年2月末、世界銀行出身の46歳のリスク管理専門家と28歳の外科医の2人の宇宙...

圧縮ビスケットは一度にどれくらい食べられますか

圧縮ビスケットは、美味しくて栄養も豊富なので、多くの人に好まれる食べ物です。しかし、このような食べ物...

コリアンダーを水で煮るとそばかすが取れますか?

コリアンダーは比較的一般的な植物で、ビタミン、ミネラルなどの栄養素が豊富で、多くの人に愛されています...

将来、水素燃料の飛行機で旅行できるようになるのでしょうか? |チュチュサイエンスフィクション

質問飛行機以外に、水素エネルギーはどこで利用できるのでしょうか?あ車もご利用いただけます。水素自動車...

香港オリーブ野菜

香港オリーブサラダは、現在非常に有名な香港風おかずで、完成品にして販売されることが一般的です。香港オ...

ピーナッツバタークッキーの作り方

「ピーナッツバタービスケット」といえば、誰もが知っているものです。スーパーマーケットなどのお店でいつ...

麦茶には薬効があるのでしょうか?

麦茶は、大麦を黄色くなるまで炒め、2〜3分水に浸してから飲むものです。さらに、麦茶は私の国で最も伝統...

電気技術自動車ニュース: ハンサムな外観と素晴らしい内装を備えた MG ZS は、一体何に頼って若者の注目を集めているのでしょうか?

小型SUVというコンセプトは2013年頃に誕生しました。ビュイック・アンコールの発売後の市場の強い反...

それは価値があるでしょうか?ワークステーションの改造に10,000元を費やすことで何が得られますか?

ケンブリッジ大学の人類学者ジェームズ・スズマンは、著書『仕事の意味』の中で、「人類の歴史の95%にお...

あなたは怠け者ですか?

写真/陳美林 広西医学科学院、広西チワン族自治区人民病院評論家/賈永興 上海科学技術出版社、大衆医学...

テレビの品質を追求する消費者が増えています。 Amlogic は人気がなくなるかもしれない。 MstarとHiSiliconが市場を独占すると予想される

最新だからといって最高というわけではなく、ハイエンドだからといって引用符で囲む必要がある場合もありま...