ミケランジェロの絵画には実はAI絵画の秘密が隠されている? !

ミケランジェロの絵画には実はAI絵画の秘密が隠されている? !

ChatGPTやWenxin YiyanなどのAIGC(人工知能生成コンテンツ)ツールの人気により、AI(人工知能)テクノロジーは静かに私たちの日常生活に溶け込み、仕事の効率を大幅に向上させ、人生経験を豊かにするとともに、想像力と創造力を刺激しています。この AI テクノロジーの波の中で、AI ペイント テクノロジーは驚くべき創造的な成果をもたらすことから、AI 分野で注目されるようになりました。

では、AI ペインティングとは一体何なのでしょうか?どのような機能があり、どのような原理と技術に基づいて動作するのでしょうか? AI絵画の不思議な世界に入り込んで調べてみましょう!

AIペインティングが無限の可能性を解き放つ

AI は、人間の知能をシミュレート、拡張、拡大するための理論、方法、テクノロジー、アプリケーション システムを研究および開発する新しい技術科学です。それはまた、新たな技術革命と産業革命の重要な原動力でもあります。 AI技術の幅広い応用の中でも、AIGC技術は特に注目に値します。この技術は高度な機械学習モデルに基づいており、膨大なデータセットを分析・学習することで、テキスト、画像、動画、音楽などさまざまなコンテンツを生成することができます。これは、AI の革新的な可能性を示すだけでなく、コンテンツ作成者、デザイナー、エンジニアなどの専門家に大きな利便性とインスピレーションを提供します。

AI絵画

AIGC技術の応用例として、AIペインティングはインターネットやデジタルアートの世界で重要な位置を占めています。 Midjourney、Stable Diffusion、Wenxin Yige などのプラットフォームの助けを借りて、AI ペインティングは人々が大量の高品質の画像を素早く作成するのに役立ちます。低コスト、高い制御性、高い効率性により、教育や娯楽など生活の多くの分野で重要な役割を果たします。

ミケランジェロの言葉には実はAI絵画の秘密が隠されている

「像はすでに石の中にあったので、不要な部分を取り除いただけです。」

イタリアの芸術の巨匠ミケランジェロのこの発言は、彫刻家としての彼の創作哲学と手法を述べているが、AIによる絵画の基本原理も明らかにしている。 AI ペインティングのプロセスは、本質的には、ランダム ノイズを多く含む初期画像から始まり、AI アルゴリズムによって「冗長」ノイズを徐々に除去し、最終的に特定のニーズを満たす明確で具体的な画像を「彫刻」します。ここでのランダム ノイズとは、画像内のノイズのような、入力データ内のランダムな情報要素を指します。明確な数式で表現することはできず、画像が生成されるたびにわずかな変化が生じます。モデルの多様性と創造性を高めるために使用されます。

このプロセスを理解するために、AI ペイント ツール Stable Diffusion を使用して説明することができます。 Stable Diffusion という名前自体は、その動作原理、つまり「拡散」プロセス (実際にはトレーニング プロセス) を示しています。世界的に有名な絵画「モナ・リザ」を例にとると、目を細めると絵がぼやけ始めますが、これはAI絵画における「前方拡散」のアナロジーです。この段階では、AI はぼやけた画像を分析し、その形態学的特徴を学習して理解し、ディープラーニングを利用して大量の画像から特徴データを抽出し、それをテキストラベルに対応させて巨大なデータベースを構築します。

拡散モデリングの基本原理

特定のスタイル(アニメスタイルなど)のモナリザ画像を生成する必要がある場合、トレーニングされたニューラル ネットワークは、指定されたプロンプト ワードに基づいてデータベースから関連する特徴を取得し、「逆拡散」プロセスを開始します。これにより、画像内のノイズが徐々に低減され、画像が鮮明になります。このように、ニューラル ネットワークは、複雑なアルゴリズムと膨大なデータ セットに基づいて、石から徐々に美しい彫像を彫り出すように、ノイズの多い画像をユーザーのニーズを満たす鮮明な画像に徐々に変換することができます。

AIペインティングでクリエイティブな旅を簡単に始めましょう

テクノロジーが進歩し、普及するにつれて、AI ペイントの使用はよりシンプルで直感的なものになります。このプロセスを制御する鍵は、AI に正確なテキスト指示、つまりプロンプトワードを提供することです。 AI が私たちのニーズを正確に理解するためには、プロンプトの単語に画像のテーマ、絵画のスタイル、画像のパラメータの説明が含まれている必要があります。説明が詳細であればあるほど、AI が期待に応える作品を作成するのを支援するのに役立ちます。

AI ペイントツールである Midjourney を例にとると、典型的なプロンプトでは、画像の主題、スタイル、設定、構成、照明などの要素を詳細に説明し、画像のパラメータも設定する必要があります。たとえば、「部屋で本を読んでいる男の子の油絵。男の子は青いシャツを着ています。背景は散らかった部屋、薄暗く柔らかい光、正面、画像サイズは 16:9」というプロンプトの単語を編集すると、AI がより適切に画像を生成できるようになります。

Midjourney AI プロンプトワード (上) と画像生成インターフェース (下)

プロンプトの単語に従って、AI は出力として 4 つの画像を生成します。インターフェイス上の「U」および「V」コントロールは、それぞれ拡大出力と最適化された変更オプションを表し、各ボタンの後の数字は、生成された 4 つの画像のいずれかに対応します。たとえば、最初の画像が要件を満たしている場合は、「U1」をクリックすると、AI が画像を拡大して出力します。 2 番目の画像が要件に近いが、さらに最適化が必要な場合は、「V2」をクリックすると、AI が 2 番目の画像に基づいて 4 つの画像を再度生成します。この画像のバッチがまだ要件を満たしていない場合、ユーザーはプロンプトワードを調整するか、インターフェイスの右側にあるループボタンをクリックして、元のプロンプトワードに基づいて 4 つの画像を再生成するように AI に指示できます。これらの手順は、AI を使用した画像生成の基本的な操作ワークフローを構成します。

他の AI 描画ツールもほぼ同じように動作します。 Baidu の AI 描画ツール Wenxin Yige では、ユーザーは簡単なプロンプトを入力し、左側のプロパティ バーでアスペクト比、描画スタイル、描画モードなどのパラメータを設定し、「今すぐ生成」をクリックするだけで美しい画像が生成されます。

AIによる絵画はもっとクールで楽しいものになる

AI ペイント技術の継続的な反復と進化により、一連の高度な生成方法と画像最適化機能が登場し、ユーザーが画像を作成する方法と手段が大幅に充実しました。これらの機能は、画像生成の効率と利便性を向上させるだけでなく、ユーザーにアートワークをカスタマイズおよび最適化して、個人の創造的ニーズをより正確に満たすという前例のない能力も提供します。引き続き Midjourney を例に、AI ペインティングがどのように「プレイ」されるかを見てみましょう。

写真から画像へ

既存の絵の特定の要素を取り入れた新しい絵を作成したい場合、既存の絵を参考にして、プロンプトの単語とともに AI に送信できます。このようにして、新しく作成された画像は、参照画像の特性をある程度反映することになります。たとえば、川を航行する貨物船の写真があり、それを油絵風に再解釈したい場合、その写真と油絵風のプロンプトワードを AI に送信するだけで、AI が油絵風のまったく新しい絵画を作成します。

元の画像(左)と画像によって生成された画像(右)

画像のブレンド

AIは異なる画像(最大4枚)を混合できます。 AIはまずこれらの画像の内容や特徴を分析し、それらを有機的に組み合わせて新しい作品を生み出します。このプロセスにより、予期せぬ創造的な結果が生まれることもあります。たとえば、サッカーをしている小さな男の子の写真と庭の写真を融合することで、AI は庭でサッカーをしている小さな男の子のまったく新しい写真を作成できます。新しく生成された画像は、少年と庭の本来の特徴を維持でき、2 つのシーンの組み合わせが違和感なく見えます。

元の画像(左)と画像を混合した後に生成された結果(右)

部分的な塗り直し

AI を使用すると、ユーザーは画像の特定の領域を調整または変更することもできます。この機能により、画像の詳細に対する制御が大幅に強化され、クリエイティブな画像効果を作成できるようになります。たとえば、画像内の女の子の顔や頭にサングラス、マ​​スク、ヘルメットなどの新しい要素を追加するには、ユーザーはこの機能を使用して AI に特定の領域を調整するように指示するだけで済みます。このようにして、新しく追加された要素を元のシーンに調和的に統合することができ、全体的なイメージの一貫性と自然さが確保されます。

元の画像(左)と部分的に再描画された画像(右)

文字の一貫性を保つ

AI による絵画の分野では、AI が複数の絵の中で単一のキャラクターの一貫性を維持することが難しく、同じキャラクターの連続した絵を生成することが難しいという大きな問題が常にありました。しかし、最新のMidjourneyアップデートでは、私たちが提供するキャラクターのポートレートとプロンプトワードに基づいて、AIがさまざまなシーンやアクションポーズの参照画像と一致するキャラクターを生成できるようになりました。この機能の登場により、AI を使用して漫画、映画やテレビのストーリーボード、さらにはポートレート写真を作成できるようになりました。

オリジナル画像(左)とAI生成連続画像(右)

現在、AI技術は映画やテレビ、オフィス、医療などの分野で実用化されています。 AIのサポートにより、面倒な作業を簡単に完了し、創造的なアイデアを簡単に実現することができます。現在の AI ペイント技術は制御性の面でまだ課題があり、実際の出力結果と期待の間に乖離が生じていますが、技術の急速な発展は大きな可能性を秘めていることを示しています。 AI ペインティングは徐々に芸術やデザインの分野で重要なツールになりつつあり、クリエイティブな人々に新しい分野を探求する機会を提供しています。テクノロジーが進歩するにつれ、AI ペインティングがさらに高いレベルの創造力をもたらし、人間と AI のコラボレーションと共創の新しい時代を切り開くことが期待されます。

文/ジャン・ビン、メン・ファンミン 写真/インターネット

<<:  目が乾燥している場合は、目薬をさすだけでいいですか?

>>:  ハエを打つのはなぜこんなに難しいのでしょうか?ポジショニングに注意してください!実は彼らは密かに高度な数学を学んでいたのです...

推薦する

スパイス塩漬けアヒルの卵

五香塩漬けアヒルの卵は、多くの人に好まれています。このような卵は独特の味があり、食べても人体に無害で...

耳にあるこの小さな穴は「富」の象徴ではありません!危険な穴かもしれない…

この記事は上海交通大学医学博士のXiaobo Zhou氏によってレビューされました。日常生活の中で気...

あんこスープの作り方

あんこ砂糖水の作り方は?健康を維持するために運動したり、足を浸したり、薬膳などの食事療法で健康を維持...

ひき肉豆腐の作り方

豆腐は栄養価が高く、ひき肉豆腐も豆腐の調理法の一つです。豆腐は大豆製品であり、体に必要な重要な栄養素...

豚バラ肉のスープの作り方

豚の胃のスープを飲むのが好きな人はたくさんいます。豚の胃は豚の胃なので、安心して飲むことができます。...

ベジタリアンチキンの煮込みの作り方

私たちは日常生活の中でベジタリアンチキンをよく食べるので、ベジタリアンチキンは誰にとっても馴染み深い...

「ドリアンブラインドボックスを開ける」がまた人気です。ここでは、「夢のラブ ロータス」を最も高い確率で選ぶのに役立つ 4 つのヒントを紹介します。

ドリアンは、その豊かな香りから物議を醸しており、愛されると同時に嫌われる果物でもある。最近、「ドリア...

家庭でリャンピを作る方法

おいしい料理を食べるためにレストランに行く必要はなく、自分で作ることができることもあります。地元の名...

キャビア寿司の作り方

暑い夏に何を食べたらいいでしょうか?食べたくないのに、お腹が空いています。夏はダイエットが一番の悩み...

秋にカニを食べる4つの方法

黄金の秋はカニがふっくらジューシーな時期です。しかし、美味しいカニを食べた後に、腹痛、下痢、吐き気、...

白粥と牛乳は胃に栄養を与えることができますか?お腹を養うための4つの誤解をもう信じないでください!

中国人は食事の仕方を知っており、子育ても上手です。健康を維持するための鍵は食事から始まります。 『黄...

タチウオの調理方法

タチウオの調理方法は?タチウオを食べるのが好きな友達は、さまざまな方法でタチウオを調理する方法を学び...

ヒキガエルはかつて「五毒動物」の一つに数えられていたが、現在は「三保護動物」となっている。

2023年4月、新聞に「ヒキガエル」を捕まえたために拘留された事件が掲載されました。私の友人の多く...