顔認識についてどれくらい知っていますか?

顔認識についてどれくらい知っていますか?

近年、人工知能技術の急速な発展に伴い、顔認証は人々の日常生活に溶け込みつつあり、顔をスワイプして支払いをしたり、顔をスワイプして電話をオンにしたり、顔をスワイプしてパスしたりするなど、人々の生活習慣を静かに変えつつあります。では、機械はどのようにしてこれが人間であると認識するのでしょうか?所有者が誰であるかをどうやって識別するのでしょうか?次に、この「ブラックテクノロジー」の背後にある謎を一緒に探って解明しましょう。

顔認識技術の概要

顔認識技術は生体認証技術の一種です。人の顔の特定の特徴(目、鼻、口、眉毛など)に基づいて、自動的に人物を識別する技術です。顔認識、肖像認識、容姿認識、顔認識などとも呼ばれます。主にカメラやビデオカメラを使用して顔が含まれる画像やビデオストリームを収集し、顔検出技術を使用して顔があるかどうかを分析します。そうであれば、顔の位置、大きさ、主要な顔の器官の位置に関する情報が得られます。次に、この情報に含まれる識別特徴を抽出し、既知の顔の特徴と比較して、各顔の識別を行います。

顔検出

顔検出は、顔認識および顔分析システムにおける最初の重要なステップです。これは主に、「顔はどこにあるのか」という問題を解決し、画像内の顔の位置とサイズを正確に調整し、その後の顔の特徴分析と認識に提供するために使用されます。初期の顔検出作業は主に手動で設計されたローカル記述子に基づく特徴抽出に基づいており、知識ベースの顔検出方法、モデルベースの顔検出方法、特徴ベースの顔検出方法、外観ベースの顔検出方法の 4 つのカテゴリに分けられます。その中でも、より古典的な研究としては、ハールカスケード分類器や HOG (Histogram of Oriented Gridients) 特徴検出アルゴリズムなどがあります。しかし、従来の検出では、複数の変動要因がある難しい画像に対する顔検出の精度が限られています。

図 WIDER FACE: 顔検出ベンチマーク

ディープラーニングの活発な発展に伴い、さまざまなディープラーニングアーキテクチャに基づく多くの顔検出方法が徐々に進化してきました。主に、カスケードCNNモデル、R-CNNモデル、シングルショット検出器モデル、特徴ピラミッドネットワークモデル、トランスフォーマーモデルなどが含まれており、従来の顔検出と認識の特徴抽出、精度、スケーラビリティが大幅に向上しました。 MTCNN は優れた顔検出モデルの 1 つです。このモデルは、3 段階の深層畳み込みネットワークを通じて、顔とランドマークの位置を大まかから細かく予測します。具体的な手順は次のとおりです。ステージ 1: 浅い CNN を使用して候補ウィンドウをすばやく生成します。ステージ 2: より複雑な CNN を使用して、多数の顔以外のウィンドウを拒否することでウィンドウを改良します。ステージ 3: より強力な CNN を使用して結果を再度調整し、5 つの顔のランドマークの位置を出力します。

顔の特徴

顔の特徴は、顔の表現とも呼ばれ、顔の長さ、顔の幅、唇の幅、鼻の長さなど、顔の特定の特徴です。顔の特徴抽出は、顔の特徴をモデル化してベクトル化された顔の特徴を取得するプロセスです。顔の特徴抽出は、その技術的特徴によって、大域情報に基づく全体論的手法、局所情報に基づく局所的特徴手法、ディープラーニングに基づく手法の 3 つに大別できます。ディープラーニングに基づく顔の特徴は、データセットから特徴を自動的に学習できます。データ セットが十分に堅牢なデータ (照明、姿勢、表情など) をカバーできる場合、アルゴリズムはさまざまな課題に適応できます。これは現在主流の顔の特徴抽出方法でもあります。

顔認識

顔認識は顔を比較するプロセスです。抽出された顔の特徴を比較することで、2 つの顔の類似性が得られます。判定方法は、2つの特徴間のユークリッド距離(L2距離)またはコサイン距離(コサイン距離)を比較することです。L2距離が小さいほど、類似性が高くなります。コサイン距離角度が小さいほど、コサイン距離が大きいほど、類似度が高くなります。アライメント数に応じて、1:1 と 1:N に分けられます。最も一般的な 1:1 シナリオは、高速鉄道に乗るときに遭遇する機器などの人物と文書のマッチングです。 1:N は、1 つの顔をデータベース内の N 個の顔と比較することを意味します。例えば、出勤簿機の顔データベースには、会社全体の顔写真がすべて保存されています。

著者: 金建超

部署:中国移動スマートホームオペレーションセンター

<<:  他人のために 50 万人の赤ちゃんを育てて、その後で返さなければならないなんて、一体どういうことなのでしょう?

>>:  スターシップの打ち上げは失敗したが、宇宙飛行の次の時代が到来する

推薦する

便秘の場合でもミルクタブレットを飲んでも大丈夫ですか?

ミルクタブレットはカルシウムを多く含み、カルシウム補給に役立つため、好んで食べられます。私の周りでは...

マスク氏はテスラのバッテリーは100%リサイクル可能だと主張するが、専門家は反論している。電気自動車は依然として環境リスクをもたらす

電気自動車が燃料自動車よりも環境に優しいかどうかは、今でも多くの自動車愛好家が熱心に議論している話題...

子宮が冷えた女性は、何を食べるべきか?子宮を温めて冷えを解消する8つの食事療法

多くの女性が手足の冷え、月経不順などを経験しますが、これらはすべて子宮の冷えが原因です。子宮の冷えは...

朝にレモン水を飲むことのメリット:免疫力を高め、血行を良くする

レモンにはさまざまな抗酸化物質が豊富に含まれています。朝にレモン水を一杯飲むだけで気分がすっきりしま...

トウモロコシ、レンコン、豚スペアリブのスープ

トウモロコシにはビタミンやナイアシンなどの成分が豊富に含まれており、胃腸の運動を刺激し、便秘を効果的...

大根と豚肉の千切りの作り方

秋から冬にかけて、大根やキャベツをたくさん買って保存しておき、調理する人も多いでしょう。この季節はイ...

旧暦1月5日はなぜ「坤」と呼ばれるのでしょうか?どうやって「破る」のか?

この記事は、古代の民間文学の人気科学ライターであるシャオ・リン氏によってレビューされました。時は経つ...

ロバ肉団子の作り方

餃子は、特に暑い夏に私たちが好む食べ物の一つです。夏が来ると食欲があまりなくなるので、餃子をより頻繁...

年末年始は安全に気をつけて、休まないでくださいね!

元旦には多くのお祝いやビジネス活動があります人と物流の集中化火災リスクが高いセキュリティ対策を強化す...

寝る前にクコの実を噛むとどんな効果があるのか

成都中医薬大学中医薬情報部の准研究員である Pu Zhaohe 氏は次のようにコメントしています。「...

エベレスト山はなぜ成長しているのでしょうか? |テクノロジーウィークリー

周ShuyiとWang Xiangが編纂地球温暖化が1.5℃を超えると、元に戻ることはできないかもし...

黄耆とナツメのスープ

黄耆と紅棗のスープは、単純な黄耆と紅棗だけではありません。通常、このスープの効果をより包括的にするた...