映画のこれらのプロットを覚えていますか? 『トランスフォーマー2』では、若い男性主人公とその友人たちが検問所を通過したとき、当直中の兵士を騙したものの、軍の顔認識技術によって発見されてしまった。 2014年の『ロボコップ』のリメイク版で、ロボコップが初めて一般公開された。彼は群衆の中の顔をすべてスキャンし、指名手配犯のデータベースと比較し続けた。彼は一瞬にして、群衆の中に長年逃亡中の指名手配犯がいることに気づき、その犯人を制圧した。他の多くの映画では、米国のあらゆる機密部門は、初期の映画での指紋や虹彩から今日の顔まで、入室時にさまざまな生体認証特徴をスキャンすることを義務付けています。 顔認識とは一体何でしょうか? 顔認識は視覚パターン認識のサブ問題であり、おそらく解決するのが最も難しい問題です。 実際、私たち人間は視覚的なパターン認識を常に行っています。私たちは目を通して視覚情報を取得し、この情報は脳によって処理され、意味のある概念として認識されます。そうすれば、目の前に置かれているものがカップなのか、本なのか、それとも何か他のものなのかが分かります。 顔認識も常時行っています。私たちは日々の生活の中で数え切れないほど多くの人々に会い、身近な人々を認識し、挨拶し、交流し、その他の見知らぬ人々を無視します。借金があってまだ返済できない人達とも関わらないようにしてください。 コンピュータにとって、画像は、静止画像であれ、動的なビデオのフレームであれ、多数のピクセルで構成されたマトリックスです。たとえば、1080p デジタル画像は、1980 x 1080 ピクセルで構成されるマトリックスです。 8 ビット RGB 形式の場合、各ピクセルは 0 から 255 までの値を持つ 3 つの数値です。 マシンは、データの特定の部分がどのような概念を表しているか、つまり、データのどの部分がカップで、どの部分が本で、どの部分が顔であるかを判断する必要があります。これは視覚パターン認識における粗い分類問題です。 顔認識では、機械が顔であると判断するすべてのデータの中から、その顔が誰のものであるかを区別する必要があります。これは詳細な分類の問題です。 顔はいくつのカテゴリーに分類できますか? 処理される問題の顔データベースのサイズによって異なります。顔データベース内のターゲット顔の数に応じて、マシンは対応する数のサブ分類を実行する必要があります。機械が見るすべての人を認識するようにしたい場合、顔を世界中の人の数と同じ数のカテゴリに分類することができ、これらのカテゴリ間の違いは非常に微妙です。これは顔認識の難しさを示しています。 言うまでもなく、この問題は照明、角度、顔の装飾など、さまざまな要因によっても影響を受けます。これは、顔認識技術が日常生活でまだ広く使用されていない理由、そしてほとんどの人が顔認識にSF映画でしか触れることができない理由も説明しています。 違いを見分けるのは難しい - 混同しやすい概念もある 人々にとってあまり馴染みのない事柄には、多くの概念的な混乱が伴うことがよくあります。 例えば、西洋の宗教に詳しくない中国人は、なぜ一部の人々が神を信じているのにイエスを信じないのか理解できないかもしれません。あるいは、教会で働く叔父の中にはセックスを控えなければならない人がいる一方で、他の人は結婚できる人がいるのはなぜか。 顔認識は新しいものであるため、多くの概念的な混乱も伴います。顔認識を理解するには、これらの概念を区別することが重要です。 顔検出と顔認識 顔認識作業を完了するにはいくつかのステップがあります。まず、コンピューターは画像またはビデオ内の顔の位置を見つける必要があります。この部分の作業は一般に顔検出と呼ばれます。前述したように、これは大まかな分類です。特に顔検出の場合、これは実際にはバイナリ分類です。コンピュータは、対象の画像が顔であるかどうかを判断するだけです。しかし、顔の大きさや位置は事前に判別できないため、コンピュータは画像全体をあらゆる顔の大きさでスキャンし、サブウィンドウで捉えた画像が顔であるかどうかを一つ一つ判別する必要があります。各スキャン処理中、サブウィンドウの移動のステップ サイズは数ピクセルになる場合があります。 したがって、コンピューターが写真の顔を検出するためにバイナリ分類の判断を何回行う必要があるかは大まかに想像できます。 顔検出ステップでは、画像から顔の位置とサイズを取得し、画像のこの部分を、顔の構成要素のポイントの配置、顔画像の位置合わせと正規化、顔画像の品質の選択、特徴の抽出、特徴の比較などの後続のステップに送信します。すべての手順が完了した後にのみ、顔の身元が判明します。 もちろん、顔検出機能のみを使用して特定のアプリケーションを完了することもできます。たとえば、現在のほとんどのカメラや携帯電話のカメラには顔検出機能があり、顔の位置を自動的に取得して、自動的に焦点を合わせ、画像を最適化できます。性別、年齢、さらには外見など、顔に関する予備的な判断を下すこともできます。 1対1の顔認証と1対Nの顔検索 主人公は様々な手段を使って何重もの本人確認を突破し、機密部署への侵入に成功する。これは映画によく出てくる筋書きです。そして、これらの本人確認の層には、顔認識が含まれることがよくあります。このようなアプリケーションでは、多くの場合、ユーザーは自分の ID を提供する必要があります。 例えば、ドアカードを使用する場合、コンピュータはドアカードを介してバックグラウンドでドアカード所有者の顔サンプルを取得し、それを現在ドアカードを使用している人の顔画像と比較して、現在ドアカードを使用している人がドアカードの所有者と一致するかどうかを確認することができます。これにより、ドアカードを拾った人が簡単に会社に侵入するのを防ぐことができます。 これは1対1のID認証です。コンピュータは現在の顔と保存されている顔を比較します。この顔は他の検証方法の補助として機能し、それによって本人認証の信頼性が向上します。この種のアプリケーションは、機密施設へのアクセス、インターネット金融分野での遠隔口座開設、大口引き出しの際の本人確認など、すでに広く使用されています。 冒頭で触れた「ロボコップ」のシーンは1対Nの顔探しです。ロボコップは指名手配中の犯罪者のデータをすべて保存している顔データベースをオンラインで検索できます。彼は人と会うたびに、まずその人の顔情報を入手し、その情報を使って指名手配犯データベースと一人ずつ照合します。一致率が高ければ、その場で逮捕されるだろう。顔が認識されるたびに、コンピューターは n 回の顔比較を実行する必要があります。ここで、n は認識されるライブラリ内の顔テンプレートの数です。 コンピュータが顔のみに基づいて人物の身元を認識する必要がある場合、これは実際には 1vN 顔検索です。対象となる顔ライブラリは、n 個の顔で構成される「知人ライブラリ」です。 n が増加すると、正確な認識の難易度が増し、1 回の認識に必要な計算時間も増加します。考えてみましょう。平均的な人は何人の顔を正確に認識できるでしょうか?おそらく数十個くらいでしょう。 現在利用可能な最高の顔認識技術は、実際にはこのレベルを超えています。 例えば、国内トップクラスの顔認識技術を持つ企業は通常、自社の各種カメラで撮影した人物の行動を表示し、正確に身元を識別するスクリーンウォールを備えている。同社は通常、数百人の顔のデータベースを保有している。しかし、N が数千人または数万人のデータベースにまで増加し続けると、一意の一致する顔をリアルタイムで検索することは SF の要件になります。顔データベースが大きいアプリケーションでは、リアルタイム要件は一般的に低く、手動検索の範囲を狭めるために、非常によく一致する上位 m 個の疑わしい顔のみを見つける必要があります。 この記事の表紙画像は著作権ライブラリからのものであり、複製は許可されていません。 |
<<: 食品安全 |ネットセレブの塩には本当の「塩価値」があるのでしょうか、それとも単なる「IQ税」なのでしょうか?専門家は「目を開けろ」と提案
>>: 新着!神舟14号の乗組員が軌道上で祖国の美しい風景を撮影 →
私たちの生活の中には蜂蜜が大量に存在し、蜂蜜には多くの種類があることは、ほとんどの人が知っていると思...
「神州」と「天州」についてどれくらい知っていますか?どちらも「周」という同じ名前ですが、違いは何でし...
牛のブリスケットは、牛の腹から肋骨までのゆるい肉です。牛のブリスケットの特徴は、赤身が多く、脂肪と腱...
年末の健康診断では、脂肪肝と診断される人が多かったです。脂肪肝は重篤でも軽症でもなく、特別な症状もな...
ブロッコリーは香りがよく、好きなさまざまな食べ物と組み合わせるのに適しているため、私の友人の多くが好...
この記事は、華東理工大学食品医薬品規制研究センター副所長兼教授の劉少偉氏によってレビューされました。...
植物には視覚がありますか?著者 |シャオイエ南米チリの熱帯雨林には、ボキラ・トリフォリオラータと呼ば...
青海チベット高原青海チベット高原は地球の頂上に位置している平均高度4,000メートル以上毎年、約9,...
夏になると、飲み物の選択肢が非常に多くなります。ビールを飲んだり、涼むためにコーラを選んだりできます...
「私たちはまだ世界の気候目標の達成には程遠い。」 「2023年は記録上最も暖かい年でした…2024年...
皆さんご存知の通り、ヨーグルトの栄養価は非常に高く、私たちもこのような美味しい食べ物を食べるのが好き...
国家郵政局の公式WeChatアカウントによると、 2023年11月11日、全国の郵便速達会社が集荷し...
痛風のような病気は、すでに非常に一般的です。痛風の原因をご存知ですか?この病気は、私たちの日常の食生...
妊婦はカボチャの種を食べても大丈夫でしょうか?妊婦自身も含め、多くの人がこのことを知りません。これは...
制作:中国科学普及協会著者:郭飛(煙台大学)プロデューサー: 中国科学博覧会SF映画では、ミクロレベ...