ミケランジェロの絵画には実はAI絵画の秘密が隠されている？！

ChatGPTやWenxin YiyanなどのAIGC（人工知能生成コンテンツ）ツールの人気により、AI（人工知能）テクノロジーは静かに私たちの日常生活に溶け込み、仕事の効率を大幅に向上させ、人生経験を豊かにするとともに、想像力と創造力を刺激しています。この AI テクノロジーの波の中で、AI ペイントテクノロジーは驚くべき創造的な成果をもたらすことから、AI 分野で注目されるようになりました。

では、AI ペインティングとは一体何なのでしょうか?どのような機能があり、どのような原理と技術に基づいて動作するのでしょうか? AI絵画の不思議な世界に入り込んで調べてみましょう！

AIペインティングが無限の可能性を解き放つ

AI は、人間の知能をシミュレート、拡張、拡大するための理論、方法、テクノロジー、アプリケーションシステムを研究および開発する新しい技術科学です。それはまた、新たな技術革命と産業革命の重要な原動力でもあります。 AI技術の幅広い応用の中でも、AIGC技術は特に注目に値します。この技術は高度な機械学習モデルに基づいており、膨大なデータセットを分析・学習することで、テキスト、画像、動画、音楽などさまざまなコンテンツを生成することができます。これは、AI の革新的な可能性を示すだけでなく、コンテンツ作成者、デザイナー、エンジニアなどの専門家に大きな利便性とインスピレーションを提供します。

AI絵画

AIGC技術の応用例として、AIペインティングはインターネットやデジタルアートの世界で重要な位置を占めています。 Midjourney、Stable Diffusion、Wenxin Yige などのプラットフォームの助けを借りて、AI ペインティングは人々が大量の高品質の画像を素早く作成するのに役立ちます。低コスト、高い制御性、高い効率性により、教育や娯楽など生活の多くの分野で重要な役割を果たします。

ミケランジェロの言葉には実はAI絵画の秘密が隠されている

「像はすでに石の中にあったので、不要な部分を取り除いただけです。」

イタリアの芸術の巨匠ミケランジェロのこの発言は、彫刻家としての彼の創作哲学と手法を述べているが、AIによる絵画の基本原理も明らかにしている。 AI ペインティングのプロセスは、本質的には、ランダムノイズを多く含む初期画像から始まり、AI アルゴリズムによって「冗長」ノイズを徐々に除去し、最終的に特定のニーズを満たす明確で具体的な画像を「彫刻」します。ここでのランダムノイズとは、画像内のノイズのような、入力データ内のランダムな情報要素を指します。明確な数式で表現することはできず、画像が生成されるたびにわずかな変化が生じます。モデルの多様性と創造性を高めるために使用されます。

このプロセスを理解するために、AI ペイントツール Stable Diffusion を使用して説明することができます。 Stable Diffusion という名前自体は、その動作原理、つまり「拡散」プロセス (実際にはトレーニングプロセス) を示しています。世界的に有名な絵画「モナ・リザ」を例にとると、目を細めると絵がぼやけ始めますが、これはAI絵画における「前方拡散」のアナロジーです。この段階では、AI はぼやけた画像を分析し、その形態学的特徴を学習して理解し、ディープラーニングを利用して大量の画像から特徴データを抽出し、それをテキストラベルに対応させて巨大なデータベースを構築します。

拡散モデリングの基本原理

特定のスタイル（アニメスタイルなど）のモナリザ画像を生成する必要がある場合、トレーニングされたニューラルネットワークは、指定されたプロンプトワードに基づいてデータベースから関連する特徴を取得し、「逆拡散」プロセスを開始します。これにより、画像内のノイズが徐々に低減され、画像が鮮明になります。このように、ニューラルネットワークは、複雑なアルゴリズムと膨大なデータセットに基づいて、石から徐々に美しい彫像を彫り出すように、ノイズの多い画像をユーザーのニーズを満たす鮮明な画像に徐々に変換することができます。

AIペインティングでクリエイティブな旅を簡単に始めましょう

テクノロジーが進歩し、普及するにつれて、AI ペイントの使用はよりシンプルで直感的なものになります。このプロセスを制御する鍵は、AI に正確なテキスト指示、つまりプロンプトワードを提供することです。 AI が私たちのニーズを正確に理解するためには、プロンプトの単語に画像のテーマ、絵画のスタイル、画像のパラメータの説明が含まれている必要があります。説明が詳細であればあるほど、AI が期待に応える作品を作成するのを支援するのに役立ちます。

AI ペイントツールである Midjourney を例にとると、典型的なプロンプトでは、画像の主題、スタイル、設定、構成、照明などの要素を詳細に説明し、画像のパラメータも設定する必要があります。たとえば、「部屋で本を読んでいる男の子の油絵。男の子は青いシャツを着ています。背景は散らかった部屋、薄暗く柔らかい光、正面、画像サイズは 16:9」というプロンプトの単語を編集すると、AI がより適切に画像を生成できるようになります。

Midjourney AI プロンプトワード (上) と画像生成インターフェース (下)

プロンプトの単語に従って、AI は出力として 4 つの画像を生成します。インターフェイス上の「U」および「V」コントロールは、それぞれ拡大出力と最適化された変更オプションを表し、各ボタンの後の数字は、生成された 4 つの画像のいずれかに対応します。たとえば、最初の画像が要件を満たしている場合は、「U1」をクリックすると、AI が画像を拡大して出力します。 2 番目の画像が要件に近いが、さらに最適化が必要な場合は、「V2」をクリックすると、AI が 2 番目の画像に基づいて 4 つの画像を再度生成します。この画像のバッチがまだ要件を満たしていない場合、ユーザーはプロンプトワードを調整するか、インターフェイスの右側にあるループボタンをクリックして、元のプロンプトワードに基づいて 4 つの画像を再生成するように AI に指示できます。これらの手順は、AI を使用した画像生成の基本的な操作ワークフローを構成します。

他の AI 描画ツールもほぼ同じように動作します。 Baidu の AI 描画ツール Wenxin Yige では、ユーザーは簡単なプロンプトを入力し、左側のプロパティバーでアスペクト比、描画スタイル、描画モードなどのパラメータを設定し、「今すぐ生成」をクリックするだけで美しい画像が生成されます。

AIによる絵画はもっとクールで楽しいものになる

AI ペイント技術の継続的な反復と進化により、一連の高度な生成方法と画像最適化機能が登場し、ユーザーが画像を作成する方法と手段が大幅に充実しました。これらの機能は、画像生成の効率と利便性を向上させるだけでなく、ユーザーにアートワークをカスタマイズおよび最適化して、個人の創造的ニーズをより正確に満たすという前例のない能力も提供します。引き続き Midjourney を例に、AI ペインティングがどのように「プレイ」されるかを見てみましょう。

写真から画像へ

既存の絵の特定の要素を取り入れた新しい絵を作成したい場合、既存の絵を参考にして、プロンプトの単語とともに AI に送信できます。このようにして、新しく作成された画像は、参照画像の特性をある程度反映することになります。たとえば、川を航行する貨物船の写真があり、それを油絵風に再解釈したい場合、その写真と油絵風のプロンプトワードを AI に送信するだけで、AI が油絵風のまったく新しい絵画を作成します。

元の画像（左）と画像によって生成された画像（右）

画像のブレンド

AIは異なる画像（最大4枚）を混合できます。 AIはまずこれらの画像の内容や特徴を分析し、それらを有機的に組み合わせて新しい作品を生み出します。このプロセスにより、予期せぬ創造的な結果が生まれることもあります。たとえば、サッカーをしている小さな男の子の写真と庭の写真を融合することで、AI は庭でサッカーをしている小さな男の子のまったく新しい写真を作成できます。新しく生成された画像は、少年と庭の本来の特徴を維持でき、2 つのシーンの組み合わせが違和感なく見えます。

元の画像（左）と画像を混合した後に生成された結果（右）

部分的な塗り直し

AI を使用すると、ユーザーは画像の特定の領域を調整または変更することもできます。この機能により、画像の詳細に対する制御が大幅に強化され、クリエイティブな画像効果を作成できるようになります。たとえば、画像内の女の子の顔や頭にサングラス、マスク、ヘルメットなどの新しい要素を追加するには、ユーザーはこの機能を使用して AI に特定の領域を調整するように指示するだけで済みます。このようにして、新しく追加された要素を元のシーンに調和的に統合することができ、全体的なイメージの一貫性と自然さが確保されます。

元の画像（左）と部分的に再描画された画像（右）

文字の一貫性を保つ

AI による絵画の分野では、AI が複数の絵の中で単一のキャラクターの一貫性を維持することが難しく、同じキャラクターの連続した絵を生成することが難しいという大きな問題が常にありました。しかし、最新のMidjourneyアップデートでは、私たちが提供するキャラクターのポートレートとプロンプトワードに基づいて、AIがさまざまなシーンやアクションポーズの参照画像と一致するキャラクターを生成できるようになりました。この機能の登場により、AI を使用して漫画、映画やテレビのストーリーボード、さらにはポートレート写真を作成できるようになりました。

オリジナル画像（左）とAI生成連続画像（右）

現在、AI技術は映画やテレビ、オフィス、医療などの分野で実用化されています。 AIのサポートにより、面倒な作業を簡単に完了し、創造的なアイデアを簡単に実現することができます。現在の AI ペイント技術は制御性の面でまだ課題があり、実際の出力結果と期待の間に乖離が生じていますが、技術の急速な発展は大きな可能性を秘めていることを示しています。 AI ペインティングは徐々に芸術やデザインの分野で重要なツールになりつつあり、クリエイティブな人々に新しい分野を探求する機会を提供しています。テクノロジーが進歩するにつれ、AI ペインティングがさらに高いレベルの創造力をもたらし、人間と AI のコラボレーションと共創の新しい時代を切り開くことが期待されます。

文/ジャン・ビン、メン・ファンミン写真/インターネット

<<: 目が乾燥している場合は、目薬をさすだけでいいですか?

>>: ハエを打つのはなぜこんなに難しいのでしょうか?ポジショニングに注意してください!実は彼らは密かに高度な数学を学んでいたのです...