シャノンとボルツマンの肩の上に立って、ディープラーニングの芸術と哲学を見つめる

シャノンとボルツマンの肩の上に立って、ディープラーニングの芸術と哲学を見つめる

シャノンとボルツマンの肩の上に立って、ディープラーニングの芸術と哲学を見つめる

記事「魅力的なデータとシャノンの視点」では、物事はさまざまなレベルのランダム変数によって表示される情報によって表現されるという、私自身の「ひらめき」を紹介しました。異なるレベルのランダム変数は異なる情報を持ち、それらが一緒になって上位レベルのランダム変数の情報表現に影響を与えます。ランダム変数によって外部に表現される情報は、ランダム変数の条件付き確率分布に依存します。多くの友人もこれに同意しており、同僚もディープラーニングに似ていると考えています。

この文章の意味を本当に理解すれば、ディープラーニングの本質を理解したことになります。たとえば、人物を識別する場合、体の形、肌の色、顔の形、目、鼻筋、口角などはすべて、その人物を特徴付けるランダム変数です。機械学習の用語では、これらは特徴と呼ばれ、明示的または暗黙的になります。異なる輪郭、異なる血液型、異なる気質、異なる性格、異なるIQ、EQ...、異なるレベルの情報が総合的にこの人物を表現します。この階層的な表現は、大規模な宇宙システムや小規模な雨滴や微生物を説明するために使用できます。

シャノンが確率分布に基づいて定義した情報エントロピーは、観測されるもののランダム変数の不確実性を記述したものです。エントロピーが増加すると、不確実性も増加します。エントロピーが減少すると、不確実性も減少します。たとえば、人間の顔の場合、顔の形にはさまざまな値があり、目の大きさ、位置、まつげの長さ、相対的な位置はすべて異なる値の範囲と可能性を持ちます。これらのさまざまな特徴の可能な値を1つずつ観察すると、徐々に顔が認識されます。つまり、何かがアヒルのように歩き、アヒルのように鳴き、アヒルのように見えるのを観察した場合、それはアヒルであると考えます。

ここで言及されているのは観察ですが、これは物事に関する情報を得て物事を理解する唯一の方法です。人々は、この事物の特性について、さまざまなレベルで可能な限り徹底的に、できるだけ多く理解し、彼/彼女/それを彼/彼女/それに非常によく似たものと区別できるほど徹底的に理解する必要があります。つまり、これらのランダム変数の可能性をすべて試した後でも、彼/彼女/それは依然として他の人と異なります。説明するのは難しいように思えますが、この情報はデータとして記録されており、それがビッグデータが人気がある理由をある程度説明しています。大きいというのは、実際には、オブジェクトを識別するのに十分、詳細、深さ、タイミングが十分であることを意味します。ビッグデータ企業がよく使う戦術は、人々を騙して 360 度の顧客ポートレートを作成させることです。 360 度が何を意味するのか考える必要があります。あなたの友人や家族はあなたをどれくらい知っていますか?あなたは自分自身を360度知っていますか? 3.6度を描くことはできますか?

観察は誤差を伴い、多くの場合直接実行できません。たとえば、湖にいる魚の平均的な長さを計算したいが、湖の中でさまざまな長さの魚がどの程度分布しているかが不明な場合、どうすればそれらの魚を捕まえて測定できるでしょうか?マルコフ氏はこれは簡単だと言いました。確率分布の移行の連鎖を構築します。初期分布 P0 から、確率 P で n 回の遷移を経て、定常分布 Pn に確実に収束します。分かりませんか?ギブスはそれを理解し、ギブスサンプリング法を発明しました。ただし、ここでの転送マトリックスは、詳細な安定性条件を満たす必要があります。つまり、相互転送の確率が等しく、そうでない場合は不安定になります(注意してください)、「安定性」の前提を覚えておいてください。

「なぜディープラーニングと低コストラーニングはこれほどうまく機能するのか?」と題された最近の論文で、ハーバード大学の物理学者数名が、上記の階層的ランダム表現法について理論的レビューを行っています。私の意見では、これはハーバード大学の物理学者の優れた能力に感心せざるを得ない完璧な要約です。多くのコンピューター科学者は、複数の層を持つ派手なニューラル ネットワーク アーキテクチャ、確率的勾配最適化ソリューション、説明のつかない無意味な正規化など、すべて「技術」であると自慢しています。ここに、彼らの理論的基礎となる「道」が見つかります。論文の著者は、以下の図を使用して、ディープラーニングの分野における最も典型的な 3 つの問題、つまり教師なし学習、教師あり学習の分類と予測を要約しています。論文には誤字があるようですが、AI では認識できない可能性があります。これら 3 種類の問題はすべて、最終的にニューラル ネットワークを使用して確率分布を近似します。つまり、(x, y) の結合確率分布、または y が発生する条件下での x の条件付き確率分布、あるいはその両方を想像します。トレーニング プロセスは、この近似確率分布関数を見つけるプロセスです。

一般的なディープラーニングアルゴリズムはこれらの確率分布をどのように解決するのでしょうか?まず、これらのランダム変数の観測データ(トレーニングデータ)に含まれるシャノン情報エントロピーを計算し、これがシステムの可能な最大の情報表現(最大尤度)であると判断し、残りの部分を最小化、つまり最大値と最小値を見つけるために、数値的手法を使用します。ここには、凸関数、リプシッツ連続性(ある意味では定常仮定としても理解できる)、ラグランジュ乗数、確率的勾配降下法などの多くの数学的「算術」など、すべて「見た目に美しい」計算など、多くの仮定があります。このシャノンエントロピーアプローチに適切な制約を適用することで、大学の物理学実験で直線を当てはめるために使用したことがあるであろう、おなじみの最小二乗法を得ることができます。

トレーニングを通じてこれらの確率分布関数を見つけることは、システムが比較的安定した状態にあるという基本的な仮定を意味します。急速に進化するオープンシステムの場合、確率的方法は適さないはずです。例えば、機械翻訳は比較的安定したものの言語記述を処理できるはずです。しかし、ネットワーク上の新しい多様言語や、例えば数年前の「真・環伝説」のようなニッチな新しいものの場合、統計に基づく AI 翻訳はそれほど便利ではないかもしれません。周紅一氏は360マーケティングフェスティバルで生放送におけるAIのパフォーマンスを総括し、「コンピューターは円錐形の顔をすべて美人と定義している」と述べた。

もう一つの例はボルツマンマシンです。ハミルトン自由エネルギーの分布には、実際にはシステムの相対的な安定性という暗黙の仮定があります (ボルツマン分布は、「平衡状態」における気体分子のエネルギー分布法則です)。不安定なシステムの場合は、Prigogine に頼る必要があります。したがって、AI の「知能」がますます向上することを歓迎する一方で、それが適用できない状況もあることを冷静に認識する必要があります。この文章自体を除いて、普遍的な真実は存在しないことを信じてください。この件を疑っている私を除いて、他のすべては疑うに値する。

私にもアドバイスがあります。 AI がいかに強力であっても、統計に基づく予測を信頼する際には慎重になるようにしてください。この農民の諺を見れば分かるでしょう。私はただ、将来どこで死ぬのかを知りたいだけなのです。そうすれば、そこへは行かなくて済むのです。

著者: 王清発、データ専門家、Chief Data Officer Alliance 専門家グループのメンバー

<<:  中国の作家が再びヒューゴー賞を受賞した。 「時空の画家」の画家は誰ですか?

>>:  「食品の栄養についてどれだけ知っていますか」丨冬虫夏草は冬虫夏草の「親戚」ですか?

推薦する

漬物の危険性は何ですか?

中国では漬物はとても一般的です。一般的に、人々は冬を乗り切るためにたくさんの食べ物を漬けます。この習...

光は分子振動を引き起こし、癌細胞を破裂させます! |サイエンスデイリー

01抗生物質耐性菌「スーパーバグ」の排除アマースト大学の研究チームとその協力者は、病原体が宿主細胞へ...

蚊を見つけたら叩き殺したいですか?恐竜もそう思ったかもしれない

蚊は毎年夏の夜になると、その独特のブンブンという音で私たちの気分を台無しにしますが、蚊を嫌うのは人間...

製品とサービスの融合が国内カラーテレビ業界の変革の焦点となっている

昨年後半から今年前半にかけて、カラーテレビ市場の主要ブランドの売上は程度の差はあれ減少した。政策撤回...

ナツメジュースを飲むと体重が減りますか?

ナツメは健康とウェルネスに最適な果物の一つとしてよく知られています。さらに、酸ナツメ自体の味は酸っぱ...

ラズベリーフルーツケーキの作り方

誰もがケーキを見たり食べたりしたことがあると思います。ケーキを作る方法はたくさんあります。最もおいし...

シリウスが超新星爆発したら、地球の生態系は破壊されるのでしょうか?科学が答えを教えてくれる

シリウスは地球から肉眼で見える最も近い恒星の一つで、約8.6光年離れています。この星が超新星として爆...

37.2兆円、それはどういう意味ですか?彼は膨大な細胞研究から生命の謎を探求する

37.2兆円、それはどういう意味ですか?私たちの体は、健康を守るために休むことなく眠ることなく働く膨...

シーバックソーン果実の効能と機能

私たちの日常生活では、誰もが果物を食べるのが大好きで、今日では多くの人が選べる果物の種類が豊富で多様...

いくつかの黒い点が乗り物酔いにさよならを告げてくれるでしょうか?

医学的には「乗り物酔い」として知られる乗り物酔いは、車、船、飛行機で旅行するときに多くの人が経験する...

ナツメと黄耆茶

中国では茶文化が長い歴史を持っています。健康茶、腸洗浄茶、薬用茶など、お茶にはさまざまな種類がありま...

最新の警告!広州は今年最も強い「水しぶきモード」に直面しています。必ず身を守ってください

最新の警告!広州は今年の洪水シーズン開始以来最大の降雨を歓迎、緊急警報水蒸気通路の形成に伴い、強い南...

警告!多くの人が食事による食道がんを咽頭炎と勘違いしている

食道がんは一見遠い病気のように見えますが、実は私たちの日常の食習慣と密接な関係があります。国際がん研...

カスタードパウダーとは

カスタードパウダーが何であるか知らない人も多いかもしれませんが、西洋のケーキの作り方を知っていれば、...

泥火山とは何ですか?

泥火山は、火山の噴火のように見える「偽の火山」です。泥火山と火山の最大の違いは、火山はマグマを噴出す...