この写真は数え切れないほどの人々を騙してきました。見たら自分の目が信じられません!

この写真は数え切れないほどの人々を騙してきました。見たら自分の目が信じられません!

まずは下の写真を見てみましょう。写真にはよくある赤いコカコーラの缶が写っていますか? 「自分の目を信じます。それは絶対に真実です。そこに必ずあるはずです」と言う人もいるでしょう。

でも、急がないでください。この写真を携帯電話やパソコンの画面で拡大して、よく見てください。何かおかしいと感じますか?そこには黒、白、青の線があるだけで、本当の赤はないように見えました。しかし、写真を元のサイズに縮小すると、赤いコーラの缶が再び現れました。

ソーシャルメディアで広く拡散された「赤いコーラ缶」の写真(右側は部分拡大) 出典:jimhejl(twitter)

現実でありながら幻想的なこの奇妙な現象をどう説明すればいいのでしょうか?心の中に善があるから光しか見えず、心の中に悪があるから闇しか見えないというのは本当でしょうか。心の中にコカコーラがあるから赤い缶しか見えないというのは本当でしょうか?

視力があなたを欺いたとしても、悲しんだり不安になったりしないでください。光学があなたの質問に答え、疑問を解決します。写真に突然色が現れることも珍しくありません。これは写真が色情報を表現する方法に関係しています

カメラ、ディスプレイ、プリンター、プロジェクターなど、あらゆる種類のデジタル画像デバイスは、ピクセル配列の形式で画像を表します。簡単に言えば、画像全体は多数の小さな正方形を基本単位として構成されており、それぞれの小さな正方形はピクセルと呼ばれ、独自の色を持っています。

20〜30年前、初期の電子ゲーム機の画質は粗く、解像度が低く、各ピクセルが大きく、画像は常にモザイクのような「グリッド感」がありました。その後、ディスプレイ技術の発達により、画像内のピクセル数が増加し、各ピクセルのサイズが小さくなったため、画像全体がよりリアルに見え、個々のピクセルは目に見えないようになりました。しかし、物事がどのように変化しても、ピクセル配列の形状は同じままでした。

もちろん、レトロトレンドに牽引されて、CryptoPunkに代表される人気のNFTアバターは、依然として明確な「ピクセル感覚」を与えてくれます(NFTの専門名称はNon-Fungible Token、非代替性トークンです)。

初期のビデオゲーム機のスクリーンショット 出典: Light Science/VEER

NFTアバター画像出典: Light Science Forum/VEER

私たちは白黒写真とカラー写真、白黒映画とカラー映画についてよく話します。実際、「白黒」は「グレースケール」を指すはずです。色はありませんが、完全な黒、濃いグレー、中間のグレー、薄いグレーから完全な白への連続的な変化があり(具体的には、グレースケール値0〜255で表現できます)、かなりの程度の画像効果と表現力をもたらすこともできます。

たとえば、1990 年代の有名な映画「シンドラーのリスト」の監督は、ほとんどの画像で意図的に無色のグレースケール効果を使用しました。ただし、技術的な制限により、真のグレースケールが実現できない場合もあります。たとえば、単純なプリンターやディスプレイでは、各ピクセルに完全な黒 (0) と完全な白 (255) しか表示できません。これは、純粋な黒と純粋な白の 2 つのブラシしかないのと同じです。これは真の「白黒」バイナリ表示と言えます。料理が上手な人は米なしでは料理ができません。異なる位置に異なるグレーの濃淡で写真を描くには、少し考えなければなりません。

男性の写真のグレースケール画像(左)、大まかな近似で得られた白黒のバイナリ画像(中央)、ピクセル最適化で得られた白黒のバイナリ画像(右)画像提供:Light Science / VEER

たとえば、外国人男性のこのグレースケール写真を表示する場合、さまざまなピクセルのグレースケール値を純粋な黒または純粋な白に直接近似すると、明るいグレーは白に「丸められ」、暗いグレーは黒に「丸められ」ます。最終的な結果は、2 枚目の写真のようにひどいもの、完全な「ピエロの顔」になります。

3枚目の写真の方がずっと快適そうです。白黒だけではなく、グレースケールの深さも可変のようです。しかし、よく見ると、ピクセルはまだこの 2 種類しかありません。 「誤差拡散」[1]と呼ばれるアルゴリズムを使用して、さまざまな領域の白黒ピクセルの比率を合理的に制御するだけです。比較的密集した黒い点がある領域は暗い領域を表し、比較的密集した白い点がある領域は明るい領域を表します。空間分布は色深度表現の精度と交換されます。それはまるで魔法のように、完全なグレースケールの表示体験をもたらします。

限られた数のブラシを使用して、同じことを実行し、無数のカラフルなバリエーションを作成することもできます。カラー表示では、赤、緑、青が三原色です。赤色光と緑色光を混ぜると黄色の光が生成され、緑色光と青色光を混ぜるとシアン色の光が生成され、赤色光と青色光を混ぜると紫色の光が生成されます。 3 つの原色をすべて混ぜ合わせると、白色光が生まれます。

理想的には、ピクセルは赤、緑、青(RGB)の原色の光を同時に生成でき、3 つのチャネルの強度を自由に調整できるため、さまざまな色を簡単に混ぜることができます。しかし理想は美しく、現実は残酷です。ピクセルが赤または青のみを表示できる場合、それを紫とどのように一致させることができるでしょうか?

下のチェッカーボードパターンでは、各正方形は赤または青で、比率は 1:1 です。左から右に向かって、グリッドが小さくなるにつれて、ピクセルが小さく密になり、赤と青が徐々に消えていき、最終的にパターン全体が紫色に変わるように見えます。

実はこれは間違っています!

すべてのパターンのすべてのピクセル (右端のピクセルを含む) には、赤と青のみが含まれます。紫色は、人間の目が赤と青のピクセルを融合することによって作り出される錯覚であり、言い換えれば、存在しない色が空中から知覚されるということです。

赤と青のブロックのサイズが徐々に小さくなり、紫に融合します。画像出典: 焦淑明

下の左側の画像では、各ピクセルで表現できる色は 256 色しかないため、より豊かな色レベルを表現することが困難です。しかし、ピクセルがより合理的に分散されると、右側の画像は明らかに見た目がより美しくなります。

元の 256 色画像 (左) と最適化された画像 (右) 画像ソース: Wikimedia Commons

有限の数のカラーピクセル位置の空間分布を通じて「無から」新しい色を作り出すことができます。時間の次元は別の方法です。

簡単な例を挙げると、多くの人が幼い頃にこのようなゲームをしたことがあるはずです。段ボールで小さな円盤を作り、その円盤を赤と黄色で交互に塗り、円盤の真ん中に小さな柱を通します。そうすると、円盤がコマのように素早く回転します。何が見えますか?

そうです、小さな円盤は赤でも黄色でもありません。しかし、2 つの色はすぐに目の前を「切り替わり」、中央のオレンジ色に「調整」されます。ディスプレイ画面でビデオを再生している場合、実際には、数十の静止画像が毎秒連続して高速で点滅しているのと同じです。人間の目には視覚の残像効果があり、それがそれらを混ぜ合わせてしまいます。この方法では、2 つの原色が交互に高速に表示されるため、融合後の新しい色が自然に目に入るようになります。

実際、上で説明した画像処理のトリックには、 「ディザリング」という特別な名前が付けられています。この物語は数十年前の第二次世界大戦中に始まります。

当時は電子計算機はまだ発明されておらず、米軍の爆撃機は飛行方向や爆撃曲線を計算するために機械式計算機しか使用できなかった。大きな箱の中にはギアやレバーの部品がたくさん入っていました。計算精度はあまり良くなかったのですが、コンピューターは非常に壊れやすく、ぶつかったり落としたりすると壊れやすいものでした。爆撃機のコックピットで上下するのは、自宅のソファーに座っているほど快適ではありませんでした。人々が最も心配したのは、激しい揺れで部品が外れて機械式コンピューターが動かなくなり、飛行機が進路を見失い、誤って爆弾が本来の位置に落とされて大惨事になるのではないかということだった。

しかし、このコンピューターは非常に正常に動作し、飛行機の揺れによる損傷も受けませんでした。さらに驚くべきは、地上で安全に使用した場合よりも計算結果が正確だったという点であり、不可解だ。この「奇妙な性質」があるため、エンジニアはかつて、飛行状態をシミュレートするための振動装置を特別に設計し、機械式コンピューターが地上で飛行感覚を体験できるようにして、計算精度を向上させました。

なぜこの人たちは飛行機で揺さぶられた後の方が仕事がはかどるのでしょうか?

これは主に、初期の機械部品は今日のコンピュータのように小数点以下の桁数まで正確に表示できず、桁数が限られているためです。精度が 10 桁 (100、110、120、130、140、...) までしか得られないと仮定すると、単位の桁を切り捨てる必要があります。たとえば、123 は 120 としか表現できず、128 は 130 としか表現できません。これは明らかに信頼性が十分ではありません。段階的に計算していくと、誤差はどんどん蓄積されていきます。

123 を毎回「ショートウェイト」の 120 で表現する代わりに、123 を時々 120 で表現し、時々 130 で表現する方が賢明です。ただし、120 に近いため、120 で表される割合はわずかに大きくなります。これは、沸騰したお湯 1 杯と 0 度の氷水 1 杯を適切な割合で混ぜると、中間の一定程度の熱さまたは冷たさを持つ温水ができるのと同じです。

機械式コンピューターを揺らすと誤差が生じ、通常は毎回四捨五入する計算がときどき失敗し、「4」という数字が四捨五入され、「5」という数字が四捨五入されてしまいます。偶然にも、「数値ブレンディング」の効果が意図せず達成されます。計算中に丸めによって生じる大きな誤差を排除するために、ランダムに小さな誤差を追加するこの方法は、「毒を以て毒を制す」という素晴らしいアイデアです。これはディザリング技術の最も古い源泉である[2]。

1946年、第二次世界大戦の終結後、世界初の近代的な電子デジタルコンピュータであるENIACがペンシルバニア大学で誕生しました。機械式コンピューターは徐々に歴史から消えていきましたが、ディザリング技術はカラー表示技術の新たな段階で輝きを放っています。

開発の初期段階から今日に至るまで、さまざまなカメラやディスプレイが色鮮やかな現実世界を忠実に記録し再現する際に直面する厄介な問題の 1 つは、多彩な色彩が不足していることです。これは数十年前の新聞や雑誌の印刷、テレビやコンピューターのディスプレイで特に顕著でした。

初期のコンピューターで数値を表すのにビット数が足りない問題を解決するために使用されたディザリング方式と同様に、画家がパレットを使用するのと同じように、複数の既存の色を使用して存在しない色を混ぜることができます。結局のところ、人間の視力はそれほど良くないので、互いに非常に近い小さなピクセルや、異なる時点で急速に変化するピクセルを組み合わせて、仮想的な色調整を行うことができます

技術の発展により、最も一般的な携帯電話のディスプレイは現在、幅広い色を直接サポートできるようになり、新しい色をゼロから作成する必要がなくなりました。しかし、研究室の特定のシナリオで使用される多くの専門的なディスプレイデバイスは、パフォーマンスの制限のために、液晶空間光変調器やホログラフィック3次元ディスプレイ用のデジタルマイクロミラーデバイスなどの関連技術に依然として大きく依存しています[3][4][5]。

色彩知覚に関して言えば、人間の視覚には他にも信じられないほど素晴らしい現象が数多くあります。例えば、下の写真を見て、カラー写真だと思いましたか?

色同化グリッドの錯視 画像ソース: stuarthumphryes (twitter)

実のところ、この画像のピクセルのほとんどはグレースケールであり、色を区別することは不可能です。グレースケール写真に重ねられたグリッド線のピクセルのみが色付けされます。

もちろん、これらのピクセルの色はランダムに設定されているわけではなく、写真内の対応するピクセルの元の正しい色と比較して飽和しています。グリッド上のピクセルの色が通常よりもはるかに明るく、彩度が高いことが簡単にわかります。それに比べて、背景のグレースケール ピクセルにはまったく色がなく、彩度は 0 です。人間の目には、この 2 つの「極端な」ピクセルが融合して、写真全体が通常の色に見えます。

この効果は色同化グリッド錯視[6]として知られており、もちろんグリッドを個々のピクセルのスケールまでより密にすることができ、「偽色」写真のほとんどのピクセルがグレースケールであるという事実を検出するのがさらに困難になります。

最後に、記事の冒頭にある赤いコカコーラの缶に戻りましょう。これは人間の目による色のもう一つの誤判断です。下のイチゴの写真にも同様の効果があります。

この画像効果を生み出すための具体的な手順は次のとおりです。

元の通常のカラー写真を多数の小さな点や細い線に分解します。線を例にとると、線は 2 つの絡み合ったグループに分けられます。 1 つのグループでは、線のピクセルの赤の成分が 0 に設定されているため、これらの線の元々赤だった部分は黒く表示され、元々赤ではなかった部分はシアン色で表示されます。他のグループでは、赤の成分は変更されませんが、緑と青の成分の強度値が最大(過飽和)に設定され、これらの線は白く表示されます。どちらのタイプのインターレース線も、緑と青の強度を上げて赤の強度を下げることに相当し、これは赤色光を除去するフィルターを通して元の写真を見ることに相当します。絵全体が水色のベールで覆われているように見えます。

この場合、実際には赤い物体であっても黒く表示されます。逆に、表面が黒く見える物体に対して、人間の目と脳は本能的にそれを赤く復元する傾向があります。コーラの缶とイチゴが「赤く染まる」仕組みです。これは色恒常性錯視[7]と呼ばれています。

オリジナルカラー画像 光科学センター/VEER

赤色の錯覚は、2 組のずらした線によって作成されます (右側は線を拡大したものです。赤色はどこにありますか?)

画像提供: 光科学センター/VEER

赤色の錯覚は、2 組の交互に並んだ正方形によって作成されます (グリッドの拡大バージョンが右側にあります。赤色はどこにありますか?)

画像提供: 光科学センター/VEER

上記の「詐欺」は、人間の視覚が特定の時間に色を区別するのが極めて弱いことを証明するのに十分ですが、さらにとんでもない例[8]を以下に示します。

私たちは本能的に、上部の物体と下部の物体の色が明らかに異なっており、一方は濃い灰色で、もう一方は白色であると感じます。しかし、指を使って 2 つのオブジェクトの境界を覆うと、2 つのオブジェクトの色がまったく同じであることがわかります。この結果は間違いなくあなたを狂わせるでしょう。

図11: 色の深さを判断する能力を覆す画像

画像出典: American Scientist.org

この記事を読んだ後でも、あなたはまだ自分の目を信じますか?

彼らはよく不可解な間違いを犯しますが、間違いを犯すたびにそれを訂正してまた同じ間違いを犯します。しかし、まさにこのような善意による欺瞞こそが、現実の物体には存在しない色で「空白を埋める」ように促し、あなたが知覚する世界をよりカラフルにするのです。

著者: Jiao Shuming (彭城研究室)

評論|曹良才(清華大学)

参考文献:

[1] RW Floyd、L. Steinberg、「空間グレースケールの適応アルゴリズム」情報ディスプレイ学会誌17、75-77(1976)。

[2] ケン・C・ポールマン(2005年)。デジタルオーディオの原理。マグロウヒルプロフェッショナル。

[3] S. Jiao、D. Zhang、C. Zhang、Y. Gao、T. Lei、X. Yuan、「デジタルマイクロミラーデバイス(DMD)と誤差拡散アルゴリズムを使用した複素振幅ホログラフィック投影」、IEEE Journal of Selected Topics in Quantum Electronics、26(5)、2800108(2020)

[4] X.ヤン、S.ジャオ、Q.ソン、G.-B. Ma、W. Cai、「位相のみのカラーレインボーホログラフィックニアアイディスプレイ」、Optics Letters 46(21)、5445-5448 (2021)

[5] K. Liu、Z. He、L. Cao、「改良された位相のみのホログラム生成のためのパターン適応型誤差拡散アルゴリズム」、Chinese Optics Letters 19(5)、050501 (2021)。

[6] S. JiaoとJ. Feng、「視覚錯覚による画像ステガノグラフィ」、Opt.エクスプレス29(10), 14282-14292 (2021)

[7]https://www.wired.com/story/remember-the-dress-heres-why-we-all-see-colors-differently/

[8] Purves D、Lotto RB、Nundy S. なぜ私たちは見ているのか:過去の経験に基づく確率的戦略は、私たちが見ているものと物理的現実の顕著な違いを説明します。アメリカの科学者。 2002年5月1日;90(3):236-43.

出典: 光科学フォーラム

この記事の表紙画像はLight Science and Technologyより提供されたものです。

<<:  物理学者が毎週金曜日に中華料理を食べるというのは本当であることが判明しました。シェルドンは私に嘘をついたことは一度もない

>>:  良いニュース:南部では蚊が暑さで死に絶えている。悪い知らせ:彼らは北に向かっている

推薦する

新車購入回避ガイド:宣伝文句に耳を傾けず、発売から6か月待ってから購入しましょう。1日200元稼ぐのと同じです。

丸まっちゃダメって言ってるけど、身体って正直ですね。建国記念日の直後、多くの自動車会社が成績表を披露...

430万台のNote7をどう扱うか?サムスンにとって新たな問題となる

Note7爆発事件からしばらく経ち、先月サムスンも爆発の原因を公に説明し、事件全体に不完全な終止符を...

メルセデス・ベンツもロゴを売って生計を立てているのでしょうか?新型Cクラスセダンエントリーモデルには1.3Tエンジンのみ搭載される可能性がある

現在市場には多くの車種があることは誰もが知っています。一般ユーザー層に影響力のある車のロゴが装備され...

レンズ豆のレシピ

レンズ豆は私たちの生活の中で最も一般的な野菜の1つです。レンズ豆は調理方法がたくさんあり、味も良いの...

新鮮な山芋を使った豚骨スープの作り方

皆さんは淮山をよくご存知だと思います。淮山芋や淮山芋とも呼ばれています。淮山は食用であるだけでなく、...

トヨタ自動車財務報告:2024年度第2四半期純利益は前年同期比55%減

トヨタ自動車は2025年度第2四半期(2024年7~9月)の決算を発表し、世界販売台数が前年同期比4...

ラオ・ドゥアン氏はこう語った。「インターネットテレビの4つの重要な変化」

2013年、テレビのインターネット化はインターネット業界とテレビ業界の双方で話題となりました。しか...

ほうれん草と豆腐のスープの作り方

ほうれん草は豆腐と一緒に調理できないと言う人もいます。ほとんどの人はこれを証明しようとはせず、ただ疑...

スマートテレビの戦いに勝つのは誰か?

2006年にインターネットテレビが登場して以来、スマートテレビは概念の推測の初期段階にありました。...

695平方キロメートル!鄱陽湖は大きくなり、渡り鳥やスナメリは喜んでいる →

中国西部での最近の秋の雨の影響で、長江の水位は徐々に上昇している。中国最大の淡水湖である鄱陽湖では今...

カニを食べると子供は思春期早発症になるのでしょうか?

カニを食べるのは好きですか?今年もカニの収穫シーズンが到来し、毛ガニが波のように人々の舌の上に押し寄...

10nm Qualcomm Snapdragon 835 が登場しました。 821/820 電話はまだ購入する価値がありますか?

冬が到来し、春ももうすぐそこです。そして、新しい主力携帯電話の登場もさらに近づいています。とても興奮...

ピーナッツのレシピ

ピーナッツは私たちの生活にとても身近な存在です。油を抽出するだけでなく、そのまま食べることもでき、一...

ニンニク抜きで肉を食べると栄養が半分になる

ニンニクは肉に含まれる有害成分を分解し、脂肪を変換し、タンパク質の吸収を促進すると言われています。そ...

そばかすを除去するのに良い製品は何ですか?

環境の悪化と生活のプレッシャーの増加に伴い、多くの皮膚の問題が徐々に現れてきました。主な問題は、皮膚...