マジックリープのコア技術が明らかに

マジックリープのコア技術が明らかに

この記事はWeChatの公開アカウント「Mr. Sai」から転載したものです。原著者: Gu Xianfeng は、ニューヨーク州立大学ストーニーブルック校の終身在職権を持つ教授であり、清華大学邱成同数学科学センターの客員教授であり、計算共形幾何学の創始者です。

2月2日、マジックリープはアリババグループが主導する約7億9,400万ドルの資金調達を実施したことを正式に発表した。同社は、Googleが主導した前回の5億4,200万ドルの投資ラウンドを含め、2014年末以来、合計13億4,000万ドルの投資を完了し、総評価額は約45億ドルとなっている。

フロリダを拠点とするこのスタートアップは数十年にわたって事業を展開しており、豪華なラインナップと大規模な事業規模を誇りますが、その中核技術については極めて秘密主義です。時折、いくつかのデモ動画が流出し、世界を驚かせ、騒動を引き起こした。では、Magic Leap の驚くべき技術的秘密とは何でしょうか?ここで、老谷は大胆な推測を行い、混乱した外見の下にあるテクノロジーの本質を探ろうとしています。

図1. バスケットボールコートの中央から巨大なクジラが飛び出します!

図 2. オフィスをゲームの戦場に変えましょう!

コンピュータグラフィックスの分野において、3次元シーンレンダリングデモンストレーション技術の進化は、ピンホールカメラ、両眼立体視、ライトフィールド、デジタルホログラフィーという歴史的段階に大別できます。つまり、ピンホールカメラ実証技術の代表作は初期のアニメ映画『ファイナルファンタジー』、両眼立体視の代表作は3D版『アバター』、ライトフィールドの代表作はマジックリープ、デジタルホログラフィック技術の代表作は『スターウォーズ』のシーンです。

図 3. ファイナルファンタジー: レイ トレーシング レンダリング、ピンホール カメラ表示テクノロジー。

図4. 「アバター」の3Dバージョン、両眼立体視。

図 5. Magic Leap、拡張現実、ライト フィールド テクノロジー。

図 6. スターウォーズ、デジタルホログラフィー。

Magic Leap は、3 次元シーン表示技術における真の革命であるライト フィールド表示技術を実現し、普及させました。かつてないほどの投資を受けたのも当然だ。では、ライトフィールドとは何でしょうか?この技術は完全に新しいものですか?この技術の開発の歴史的背景は何ですか?ライトフィールド技術からスタートした企業は他にもありますか?それぞれについては、次の説明で説明します。

ピンホールカメラ

従来の光学カメラの理想的なモデルはピンホールカメラです。コンピュータ グラフィックスでは、従来のレンダリング方法はこのカメラ モデルに基づいています。図7に示すように、カメラの光学中心から光線が放射され、撮像画面の各ピクセルを通過します。レイ トレーシングでは、幾何光学の物理法則を使用して、光線の色 (対応するピクセルの色) を計算します。図 8 は、レイ トレーシング法を使用して計算されたレンダリング画像を示しています。ここでは概念の変革が必要です。各ピクセルは点ではなく、光線です。これがライトフィールドを理解する鍵です!つまり、写真とは光の中心を通過する一群の光線です。ファイナルファンタジーは光学トレーシングを使用してレンダリングされました。

図 7. レイトレーシングにおけるピンホール カメラ モデル。

図 8. レイ トレーシングを使用してレンダリングされたシーン。

スクリーン、LCD/LED などの従来の表示方法は、各ピクセルが点として扱われ、同じピクセルの色は異なる角度から見ても変化しないという従来の概念に基づいています。つまり、この表示方法では光線の方向の情報が失われます。

両眼立体視

人間には目が2つあります。物体を見るとき、それぞれの目は像を形成します。脳は両目で結ばれた像の微妙な違いをもとに各点の奥行き情報を計算して立体感を得ています。人間の目を模倣することで、デュアルレンズカメラを使用して両眼立体写真を取得できます。

図9. 両眼ステレオカメラ。

図 10. アポロ月面着陸計画中に撮影された双眼鏡による立体写真。

本質的に、両眼立体写真は 2 つの光学中心から発せられる 2 本の光線です。 『アバター』の3D版もこの原理に基づいて制作された。単眼カメラと比較すると、両眼立体視の時間計算量と空間計算量は 2 倍になります。

ライトフィールド - マジックボックスの説明


図 11. ライト フィールドのマジック ボックスの説明。

ウサギをガラスの箱で覆い、ガラスの箱を通してウサギを観察すると仮定しましょう。箱の表面上の任意の点から、3 次元空間の任意の方向に光線が放射されます。この光線の色はウサギと照明条件によって決まります。私たちはガラスの箱を表現するには、は単位ベクトルを表し、光線は次のように表される。全ての光線の集合は次のように表される。 。各光線は色に対応しており、3 次元空間内の点で表されます。 。したがって、ライトフィールドは光線空間から色空間へのマッピングです。言い換えれば、ライトフィールドは光線空間で定義されたベクトル値関数です。

ガラスの箱の中のウサギを取り除いたとします。しかし、このガラスの箱は魔法の箱であり、ライトフィールド情報は完全に保存されています。この魔法の箱を観察すると、片方の目を通過するすべての光線が組み合わさって網膜上に画像が形成されます。距離や見る角度を自由に変えることができ、網膜上のウサギの像もそれに応じて自然に変化するので、ウサギが消えたことには全く気づかないのです。つまり、魔法の箱があれば、本物のウサギは必要なくなります。この魔法の箱はウサギの光のフィールドです。

光学の分野では、光場は古い概念です。 1996年にマイクロソフトとスタンフォード大学の学者によってコンピュータグラフィックスの分野に導入され、2016年には開発から20年が経過しました。学術界の人々は研究を深めるためにたゆまぬ努力を続けてきましたが、産業界に本当の影響を与えたのはここ数年のことです。 Magic%20Leap は、実際のアプリケーションにおける光%20場理論の頂点と見なされるべきです。

ライトフィールドレンダリング% ウサギのライトフィールドを使用してウサギを置き換え、さまざまな角度から写真をレンダリングおよび生成できるため、ウサギの幾何学モデル、テクスチャモデル、および照明モデルを構築する必要がありません。大規模なシーン、複雑な照明条件、または複雑な幾何学的モデル (ぬいぐるみなど) の場合、ライト フィールドは物理的なオブジェクトのデジタル モデルよりも単純であるか、またはレイ トレーシングによって得られるレンダリング結果よりもライト フィールドの方が現実的または効率的であるため、レンダリングにはライト フィールドを使用します。これはいわゆるイメージベースのレンダリング方式 (%20Image%20Based%20Rendering%20) です。歴史的に、Microsoft はかつて、「Deserted Island Treasure Hunt」に似たライト フィールド ベースのゲームをリリースしました。全てのシーンは実際の自然から収集されており、非常にリアルでしたが、結局何の反響も得られず、無駄に終わりました。

ライトフィールドの取得: ライトフィールドは、4 次元の光線空間で定義される関数です。従来のピンホールカメラは 2 次元の光線クラスターしか取得できないため、ライトフィールドの取得は本質的に困難です。ライト フィールドを取得する初期の方法は単純で粗雑なものであり、図 12 に示す 2 次元カメラ アレイなどの大規模なカメラ アレイを使用していました。このようなライト フィールド カメラは大きくて高価なため、大規模に入手するのは困難でした。

図 12. スタンフォードのライトフィールド カメラ: 16x8 マルチカメラ アレイ。

デジタルカメラ技術が成熟するにつれて、ピンホールカメラはますます小型化され、高密度に統合できるようになり、ライトフィールドカメラのサイズも縮小しています。ただし、図 13 に示すように、レンズのサイズを小さくすることはできません。

図 13. スタンフォード ライト フィールド カメラ: カメラ アレイ。

本当のブレークスルーはバイオミミクリーから生まれました。多くの昆虫は光場情報を取得する複眼を持っています。

図14. 昆虫の複眼:ライトフィールドカメラ。

人間は昆虫を模倣して、図 15 に示すように、大きなレンズの上に数十個の小さなレンズを統合した複眼に似たレンズを作成しました。光学技術の向上により、プラスチックフィルム上に何千もの小さなレンズが組み込まれました。このアイデアに基づいて、スタンフォード大学の博士課程の学生である Wu Ren 氏がライトフィールドカメラ会社 Lytro を設立しました。

図 15. Adob​​e が作成した人工複眼のプロトタイプ。

従来のカメラでは、写真を撮る前に焦点を合わせる必要があります。 Lytro カメラのスローガンは、「まず写真を撮り、後でフォーカスする」です。 Lytro カメラで取得されたライト フィールド情報により、ユーザーは 4D ライト フィールドからさまざまな角度と深さの 4D 写真を合成できます。

図16. Lytro カメラ。

図 17 に示すような結婚式の写真: 同じライト フィールド写真で、カメラに近い新郎に焦点を合わせることができます。カメラから遠く離れた花嫁にも焦点を合わせることができます。

図 17. Lytro の結婚式の写真: 同じライト フィールド写真でも、さまざまな領域に焦点を合わせることができます。左のフレーム、新郎に焦点を合わせます。右のフレームでは、花嫁に焦点を合わせます。

ライトフィールドディスプレイ、スクリーン、LCD/LED の従来の表示方法では、光線がスクリーンを通過する交差点の幾何学情報と色情報のみが保持され、光線の方向情報は保持されません。スクリーンは拡散反射性であり、スクリーン上の特定の点から放射されるすべての光線は同じ色であるが、ライトフィールドディスプレイでは、図18に示すように、同じ点から放射される異なる光線は異なる色を有する必要がある。ライトフィールドディスプレイは、Magic Leap のコアテクノロジーです。

図 18. 表示モードの比較: 左の画像は従来の画面で、1 つの点を通過するすべての光線が同じ色です。右の写真はライトフィールド表示で、ある点を通過する異なる光線は異なる色になります。

USC のライト フィールド ディスプレイ 南カリフォルニア大学は、図 19 および 20 に示すように、ライト フィールド ディスプレイ デバイスを提案し、製造しました。4 つの光透過面を持つガラス キャビネットがあります。キャビネットの中央には、水平面に対して 45 度の角度の鏡があります。キャビネット上部に高速プロジェクターを搭載。プロジェクターは垂直下向きに投影し、光はミラーで反射されて水平に放射されます。同時にミラーも高速回転します。幽霊のような透明な頭が空中に浮かんでいた。私たちがキャビネットの周りを歩いていると、頭のすべての側面が見え、頭が私たちにウインクしました。

図 19. USC ライト フィールド ディスプレイ、浮遊する人間の頭部。

図 20. テレビ会議システム用の USC ライトフィールドディスプレイ。


図 21. USC ライト フィールド ディスプレイの特許図。

図21はこの光場表示機器の原理を示しています。 45度傾斜ミラー(114)はモータ(115)によって回転駆動され、グラフィックプロセッサ(130)は画像を生成して高速プロジェクタ(120)に送信する。プロジェクターは鏡に画像を投影し、その画像は反射されて全方向に水平に投影されます。このようにして、厳密な同期制御を経て、3次元の光場を表示します。この装置は大きくて高価であり、高速回転ミラーによりシステムの安定性が低下します。機械的な振動はライトフィールドの表示効果に影響を与えます。

Magic Leap ライト フィールド ディスプレイ - 懐中電灯の説明 Magic Leap のコア技術は、特殊なライト フィールド ディスプレイ デバイスであるファイバー オプティック プロジェクターです。レーザーは光ファイバー内を伝播し、ファイバーポートから放射され、出力方向はファイバーに対して接線方向になります。 3次元空間でファイバーの形状を変えることで、特にファイバー端の接線方向を変えることで、レーザーの放射方向を制御することができます。これは、懐中電灯を持ち、懐中電灯の位置と方向を変えることで出力される光線の方向を変えるのと同じです。手首を素早く振ると、懐中電灯の光線が空中に円錐を描き、この円錐が壁に当たって円を形成します。手首の振動の振幅を素早く変化させることで、円の半径を制御し、ディスクを覆う一連の同心円を得ることができます。懐中電灯の光線の色が変わると、壁に色付きの円盤が描かれます。したがって、懐中電灯を素早く振ることで、画像、つまり光線のオーバーレイが得られます。多くの人がさまざまな空間位置に立っていて、それぞれが懐中電灯を振ると、ライトフィールドが生成されます。 Magic Leap のライト フィールド ディスプレイ デバイス (光ファイバー プロジェクター) はこのように動作します。


図 22. Magic Leap の懐中電灯。

図22はMagic Leapの懐中電灯を示しています。アクチュエータ(206)は人間の手首に相当し、光ファイバ(208)は懐中電灯に相当する。アクチュエータはファイバーの先端を周期的に振動させ、ファイバーの先端は螺旋状に一連の同心円を描きます。レーザーはレンズシステムを通して出力され、空気中に光線のクラスターを描きます。平面への投影によりディスクが照らされます。図 23 に示すように、ファイバーの色と強度を同期的に変更することで、タイムシェアリング技術を使用して画像が取得されます。


図 23. タイムシェアリング技術を使用して 1 本のファイバーが 1 つの画像を生成します。

Magic Leap のファイバー光プロジェクターには、2 次元アレイに組み立てられた多数の光ファイバーがあります。各ファイバーはピンホールカメラに相当し、2 次元カメラアレイは光場を生成します。

ライト フィールド ディスプレイの利点 両眼立体視と比較して、ライト フィールド ディスプレイには多くの利点があります。人間が3次元の奥行き情報を取得する方法は、「ステレオからの形状」と「フォーカスからの形状」の2つがあります。私たちは同じ物体を見るために 2 つの目を使い、3 次元空間内の同じ点が左と右の網膜の異なるピクセルに投影されます。人間の脳は網膜上のピクセルを使用して対応する空間光線を逆算し、2 つの光線の交差を取得して深度情報を取得できます。このプロセスは「ステレオからの形状」と呼ばれます。私たちの目が物体を見ると、脳は自動的に目の水晶体の曲率を調整し、その物体が網膜上に鮮明に映し出されるようにします。水晶体の筋肉の緊張を調整することで、脳は物体の奥行き、いわゆる「焦点からの形状」を計算できるようになります。 『アバター』の3D版を観る時は「立体からの形状」のみ使用しました。目からスクリーンまでの距離は変化しないため、目の焦点距離は常に固定されており、「焦点から形状」のプロセスはありませんでした。しかし、人類の長い進化の過程を経て、これら 2 つのプロセスは自然に密接に結びつくようになりました。人工的に分離すると、人々はめまいを起こします。逆に、ライトフィールドディスプレイ技術を使用する場合、「立体からの形状」と「焦点からの形状」の両方が同時に必要になるため、視聴時にめまいを感じることはありません。ライトフィールドディスプレイ技術はより自然で健康的です。

ライト フィールド ディスプレイの課題 革命の始まりとして、Magic Leap のテクノロジーは多くの課題に直面しています。最も直接的なのは、従来のディスプレイ技術では 4 次元ライトフィールド内の 2 次元スライスを計算するだけで済むのに対し、ライトフィールドディスプレイでは 4 次元ライトフィールド全体を計算する必要があり、計算の複雑さが数桁増加することです。これは技術的なボトルネックの 1 つです。同時に、各ファイバーが安定して自然に振動し、振動パターンがデータ伝送と同期し、振動が外部ノイズの影響を受けないように機械部品を精密に制御することも、驚くべき技術を必要とします。

デジタルホログラフィックライトフィールドの概念がMagic Leapの投資熱に提案されてから20年が経ち、デジタルホログラフィック技術の開発の歴史はさらに長い。ライトフィールドは本質的に幾何光学ですが、デジタルホログラフィーは波動光学です。現在、デジタルホログラフィック技術はますます成熟しつつあります。青色レーザーの発明により、カラーデジタルホログラフィック技術が可能になりました。現在の開発におけるボトルネックとしては、まず計算量が膨大で、ライトフィールド計算をはるかに超えていることです。第二に、デジタルホログラフィックディスプレイには特殊な種類の結晶が必要であり、各ピクセルの屈折率は電圧によって制御できます。現時点では、このような光学系は依然として高価で、サイズも小さいです。ライトフィールド技術がより広く受け入れられるようになるにつれて、デジタルホログラフィーも急速に発展すると考えています。

ライトフィールド技術からのインスピレーション ライトフィールド技術の歴史的発展は、破壊的な技術革命が基礎科学や非営利の学術界から生まれることが多いことを示しています。製品が学術界で成熟し、ビジネスの世界で一目置かれる存在になるまでには、数十年かかることがよくあります。 Magic Leap の技術的ブレークスルーは内視鏡技術の活用によるもので、国境を越えた科学研究の重要性を示しています。

テレビ映画がライトフィールドカメラで撮影され、視聴者が自由に視聴角度を動的に選択できるようになる日を楽しみにしています。この日が来るまであと20年待たなければならないかもしれないし、3~5年で済むかもしれない。近い将来、Taobao 上のすべての写真がライトフィールド写真に置き換えられ、Magic Leap ヘルメットがすべてのオンライン ショッピングの標準装備になると思います。 (この記事は「Lao Gu Talks Geometry」に最初に掲載され、著者の許可を得て転載されています。)

今日頭条の青雲計画と百家曼の百+計画の受賞者、2019年百度デジタル著者オブザイヤー、百家曼テクノロジー分野最人気著者、2019年捜狗テクノロジー文化著者、2021年百家曼季刊影響力のあるクリエイターとして、2013年捜狐最優秀業界メディア人、2015年中国ニューメディア起業家コンテスト北京3位、2015年光芒体験賞、2015年中国ニューメディア起業家コンテスト決勝3位、2018年百度ダイナミック年間有力セレブなど、多数の賞を受賞しています。

<<:  ファーゴ第2シーズンから見る中国とアメリカのテレビドラマのギャップ

>>:  上流と下流の未形成のサードパーティコンテンツプラットフォームが VR ステージに参入する時期が来ているのでしょうか?

推薦する

嵐の中の無線信号: 波に乗るか、それとも危うい状況に陥るか?

雷鳴や稲妻、吹き荒れる風、激しい雨が吹き荒れるとき、私たちは家の中に隠れて自然の荒々しさを感じるかも...

三国志は戦争だけを描いたものではありません。 TV版『三国志演義』がお試しプレイ可能です。

羅貫中の『三国志演義』を読んだ人なら誰でも、心に切り離すことのできない三国志コンプレックスを刻み込ま...

現実はあなたの脳の最善の推測です

© ブレイン・ラタムリヴァイアサンプレス:私たちはよく「脳のサプリメント」について冗談を言いますが、...

エビの煮込みの作り方

エビは、とても一般的な種類のエビです。誰もが食べたことがあるはずです。エビは栄養価が高く、肉はとても...

ほうれん草とトマト

ほうれん草とトマトはどちらも野菜です。この2つを組み合わせておいしい料理を作ることができます。ほうれ...

プルーンの役割

プルーンの効果は何ですか?プルーンは西洋のプラムから来ていることはわかっていますので、プルーンは我が...

朝食レシピ紹介

朝食は私たちの生活の重要な部分です。朝に昼食を食べないと、体は朝に十分なエネルギーを供給することがで...

「草」を食べるあなたへ:あなたはたくさん苦しんできましたが、体重を量るのはさらに苦しいですか?正しい食べ方を教えます →

体重を減らしたい人向け毎日何を食べるかは難しい問題です美味しいものも食べられないし、食べたいものも食...

戦闘中の出力は完全に「咆哮」に依存します。名前を読むたびに、発声の練習になります。

彼らはレッドホエザルと呼ばれています。名前を読むたびに、簡単そうで難しいと感じます。正確に発音したい...

「フィルム」を撮らなければならないと聞いて、放射線が心配になりますか?医者は真実を告げる

仕事中:コンピュータの放射線は非常に強い携帯電話で遊ぶとき:大丈夫、一日中遊べるよ健康診断でX線撮影...

サワラの調理方法

サワラは青サワラとも呼ばれます。サワラは我が国では東シナ海、黄海、渤海に生息しています。サワラは肉食...

数学的証明とは一体何なのか?丨Unroll

数学史家であり、ミューレンバーグ大学のトルーマン・ケーラー名誉数学教授であるウィリアム・ダナムは、1...

健康を維持するために、毎日のおやつをもっと食べましょう

現代人は、健康の砦を守るために、食べ過ぎたり飲み過ぎたりするのではなく、毎日「おやつ」を食べることに...

国産携帯電話がサムスンに挑戦するには何が足りないのか?

Samsung S6の発売後、Samsungブランドは回復の兆しを見せた。コリアタイムズによると、...

便秘でもフカヒレを食べても大丈夫ですか?

実際、多くの人が人生で便秘に悩まされており、あらゆる年齢層の人がこの問題を抱えている可能性があります...