ミケランジェロの絵画には実はAI絵画の秘密が隠されている? !

ミケランジェロの絵画には実はAI絵画の秘密が隠されている? !

ChatGPTやWenxin YiyanなどのAIGC(人工知能生成コンテンツ)ツールの人気により、AI(人工知能)テクノロジーは静かに私たちの日常生活に溶け込み、仕事の効率を大幅に向上させ、人生経験を豊かにするとともに、想像力と創造力を刺激しています。この AI テクノロジーの波の中で、AI ペイント テクノロジーは驚くべき創造的な成果をもたらすことから、AI 分野で注目されるようになりました。

では、AI ペインティングとは一体何なのでしょうか?どのような機能があり、どのような原理と技術に基づいて動作するのでしょうか? AI絵画の不思議な世界に入り込んで調べてみましょう!

AIペインティングが無限の可能性を解き放つ

AI は、人間の知能をシミュレート、拡張、拡大するための理論、方法、テクノロジー、アプリケーション システムを研究および開発する新しい技術科学です。それはまた、新たな技術革命と産業革命の重要な原動力でもあります。 AI技術の幅広い応用の中でも、AIGC技術は特に注目に値します。この技術は高度な機械学習モデルに基づいており、膨大なデータセットを分析・学習することで、テキスト、画像、動画、音楽などさまざまなコンテンツを生成することができます。これは、AI の革新的な可能性を示すだけでなく、コンテンツ作成者、デザイナー、エンジニアなどの専門家に大きな利便性とインスピレーションを提供します。

AI絵画

AIGC技術の応用例として、AIペインティングはインターネットやデジタルアートの世界で重要な位置を占めています。 Midjourney、Stable Diffusion、Wenxin Yige などのプラットフォームの助けを借りて、AI ペインティングは人々が大量の高品質の画像を素早く作成するのに役立ちます。低コスト、高い制御性、高い効率性により、教育や娯楽など生活の多くの分野で重要な役割を果たします。

ミケランジェロの言葉には実はAI絵画の秘密が隠されている

「像はすでに石の中にあったので、不要な部分を取り除いただけです。」

イタリアの芸術の巨匠ミケランジェロのこの発言は、彫刻家としての彼の創作哲学と手法を述べているが、AIによる絵画の基本原理も明らかにしている。 AI ペインティングのプロセスは、本質的には、ランダム ノイズを多く含む初期画像から始まり、AI アルゴリズムによって「冗長」ノイズを徐々に除去し、最終的に特定のニーズを満たす明確で具体的な画像を「彫刻」します。ここでのランダム ノイズとは、画像内のノイズのような、入力データ内のランダムな情報要素を指します。明確な数式で表現することはできず、画像が生成されるたびにわずかな変化が生じます。モデルの多様性と創造性を高めるために使用されます。

このプロセスを理解するために、AI ペイント ツール Stable Diffusion を使用して説明することができます。 Stable Diffusion という名前自体は、その動作原理、つまり「拡散」プロセス (実際にはトレーニング プロセス) を示しています。世界的に有名な絵画「モナ・リザ」を例にとると、目を細めると絵がぼやけ始めますが、これはAI絵画における「前方拡散」のアナロジーです。この段階では、AI はぼやけた画像を分析し、その形態学的特徴を学習して理解し、ディープラーニングを利用して大量の画像から特徴データを抽出し、それをテキストラベルに対応させて巨大なデータベースを構築します。

拡散モデリングの基本原理

特定のスタイル(アニメスタイルなど)のモナリザ画像を生成する必要がある場合、トレーニングされたニューラル ネットワークは、指定されたプロンプト ワードに基づいてデータベースから関連する特徴を取得し、「逆拡散」プロセスを開始します。これにより、画像内のノイズが徐々に低減され、画像が鮮明になります。このように、ニューラル ネットワークは、複雑なアルゴリズムと膨大なデータ セットに基づいて、石から徐々に美しい彫像を彫り出すように、ノイズの多い画像をユーザーのニーズを満たす鮮明な画像に徐々に変換することができます。

AIペインティングでクリエイティブな旅を簡単に始めましょう

テクノロジーが進歩し、普及するにつれて、AI ペイントの使用はよりシンプルで直感的なものになります。このプロセスを制御する鍵は、AI に正確なテキスト指示、つまりプロンプトワードを提供することです。 AI が私たちのニーズを正確に理解するためには、プロンプトの単語に画像のテーマ、絵画のスタイル、画像のパラメータの説明が含まれている必要があります。説明が詳細であればあるほど、AI が期待に応える作品を作成するのを支援するのに役立ちます。

AI ペイントツールである Midjourney を例にとると、典型的なプロンプトでは、画像の主題、スタイル、設定、構成、照明などの要素を詳細に説明し、画像のパラメータも設定する必要があります。たとえば、「部屋で本を読んでいる男の子の油絵。男の子は青いシャツを着ています。背景は散らかった部屋、薄暗く柔らかい光、正面、画像サイズは 16:9」というプロンプトの単語を編集すると、AI がより適切に画像を生成できるようになります。

Midjourney AI プロンプトワード (上) と画像生成インターフェース (下)

プロンプトの単語に従って、AI は出力として 4 つの画像を生成します。インターフェイス上の「U」および「V」コントロールは、それぞれ拡大出力と最適化された変更オプションを表し、各ボタンの後の数字は、生成された 4 つの画像のいずれかに対応します。たとえば、最初の画像が要件を満たしている場合は、「U1」をクリックすると、AI が画像を拡大して出力します。 2 番目の画像が要件に近いが、さらに最適化が必要な場合は、「V2」をクリックすると、AI が 2 番目の画像に基づいて 4 つの画像を再度生成します。この画像のバッチがまだ要件を満たしていない場合、ユーザーはプロンプトワードを調整するか、インターフェイスの右側にあるループボタンをクリックして、元のプロンプトワードに基づいて 4 つの画像を再生成するように AI に指示できます。これらの手順は、AI を使用した画像生成の基本的な操作ワークフローを構成します。

他の AI 描画ツールもほぼ同じように動作します。 Baidu の AI 描画ツール Wenxin Yige では、ユーザーは簡単なプロンプトを入力し、左側のプロパティ バーでアスペクト比、描画スタイル、描画モードなどのパラメータを設定し、「今すぐ生成」をクリックするだけで美しい画像が生成されます。

AIによる絵画はもっとクールで楽しいものになる

AI ペイント技術の継続的な反復と進化により、一連の高度な生成方法と画像最適化機能が登場し、ユーザーが画像を作成する方法と手段が大幅に充実しました。これらの機能は、画像生成の効率と利便性を向上させるだけでなく、ユーザーにアートワークをカスタマイズおよび最適化して、個人の創造的ニーズをより正確に満たすという前例のない能力も提供します。引き続き Midjourney を例に、AI ペインティングがどのように「プレイ」されるかを見てみましょう。

写真から画像へ

既存の絵の特定の要素を取り入れた新しい絵を作成したい場合、既存の絵を参考にして、プロンプトの単語とともに AI に送信できます。このようにして、新しく作成された画像は、参照画像の特性をある程度反映することになります。たとえば、川を航行する貨物船の写真があり、それを油絵風に再解釈したい場合、その写真と油絵風のプロンプトワードを AI に送信するだけで、AI が油絵風のまったく新しい絵画を作成します。

元の画像(左)と画像によって生成された画像(右)

画像のブレンド

AIは異なる画像(最大4枚)を混合できます。 AIはまずこれらの画像の内容や特徴を分析し、それらを有機的に組み合わせて新しい作品を生み出します。このプロセスにより、予期せぬ創造的な結果が生まれることもあります。たとえば、サッカーをしている小さな男の子の写真と庭の写真を融合することで、AI は庭でサッカーをしている小さな男の子のまったく新しい写真を作成できます。新しく生成された画像は、少年と庭の本来の特徴を維持でき、2 つのシーンの組み合わせが違和感なく見えます。

元の画像(左)と画像を混合した後に生成された結果(右)

部分的な塗り直し

AI を使用すると、ユーザーは画像の特定の領域を調整または変更することもできます。この機能により、画像の詳細に対する制御が大幅に強化され、クリエイティブな画像効果を作成できるようになります。たとえば、画像内の女の子の顔や頭にサングラス、マ​​スク、ヘルメットなどの新しい要素を追加するには、ユーザーはこの機能を使用して AI に特定の領域を調整するように指示するだけで済みます。このようにして、新しく追加された要素を元のシーンに調和的に統合することができ、全体的なイメージの一貫性と自然さが確保されます。

元の画像(左)と部分的に再描画された画像(右)

文字の一貫性を保つ

AI による絵画の分野では、AI が複数の絵の中で単一のキャラクターの一貫性を維持することが難しく、同じキャラクターの連続した絵を生成することが難しいという大きな問題が常にありました。しかし、最新のMidjourneyアップデートでは、私たちが提供するキャラクターのポートレートとプロンプトワードに基づいて、AIがさまざまなシーンやアクションポーズの参照画像と一致するキャラクターを生成できるようになりました。この機能の登場により、AI を使用して漫画、映画やテレビのストーリーボード、さらにはポートレート写真を作成できるようになりました。

オリジナル画像(左)とAI生成連続画像(右)

現在、AI技術は映画やテレビ、オフィス、医療などの分野で実用化されています。 AIのサポートにより、面倒な作業を簡単に完了し、創造的なアイデアを簡単に実現することができます。現在の AI ペイント技術は制御性の面でまだ課題があり、実際の出力結果と期待の間に乖離が生じていますが、技術の急速な発展は大きな可能性を秘めていることを示しています。 AI ペインティングは徐々に芸術やデザインの分野で重要なツールになりつつあり、クリエイティブな人々に新しい分野を探求する機会を提供しています。テクノロジーが進歩するにつれ、AI ペインティングがさらに高いレベルの創造力をもたらし、人間と AI のコラボレーションと共創の新しい時代を切り開くことが期待されます。

文/ジャン・ビン、メン・ファンミン 写真/インターネット

<<:  目が乾燥している場合は、目薬をさすだけでいいですか?

>>:  ハエを打つのはなぜこんなに難しいのでしょうか?ポジショニングに注意してください!実は彼らは密かに高度な数学を学んでいたのです...

推薦する

中古新品携帯販売業者の秘密を暴露:XiaomiとAppleが最も人気

秋の雨が降るたびに、気候は涼しくなります。北京は9月になると曇りや雨が降り始めました。しかし、雨の日...

ズッキーニとエビのラビオリ

ズッキーニとエビの餃子は、数ある餃子の種類のひとつで、多くの人が好んで食べる餃子の一種でもあります。...

河南省の各地に突然「白い光」が出現した。それは何ですか?

11月29日、河南省の夜空に突然「白い光」が出現したというニュースがインターネット上で話題になった...

コウモリにヒントを得て、地下のパイプの漏れを検出できる新しいスキャン技術が開発されました。

エンジニアたちは、自然界からヒントを得て、石油やガスのパイプライン内の腐食した金属を検出できる新しい...

自家製醤油の作り方

醤油を自分で作るには?一般的に、テレビで見る醤油の製造工程は時間がかかります。天候や気温の変化を考慮...

女性は猫を撫でた後に呼吸不全を起こし、集中治療室に入院した。犯人は衝撃的だ

猫を撫でることは人生の大きな喜びの一つですかわいい猫多くの場合、「うんちをすくう人」は自分自身を制御...

お子様の身長を伸ばしたいと考えていますか? Huaxi の専門家がその方法を教えます...

世界保健機関による以前の調査では、子どもの成長率は季節によって異なり、身長の伸びが最も早い季節は5月...

野菜麺の作り方

野菜麺は、その名の通り、野菜と麺で作られています。麺は我が国の名物です。麺は作り方が簡単で食べやすい...

乾燥昆布の栄養価

昆布の栄養価が非常に高いことはよく知られています。加工後の昆布は乾燥昆布となり、保存が簡単です。その...

クルミの栄養価

クルミは栄養価の高い一般的なドライフルーツです。ドライフルーツの「四大」の一つでもあります。健康に大...

白菜と鶏の羽根野菜

いわゆる白菜鶏羽菜とは、白菜と鶏羽菜のことを指します。キャベツは誰もがよく知っている食べ物です。ほと...

頭を切り落とされた後も、この鶏はさらに2年間生き続けました!

1945年4月、アメリカがナチスドイツの中心部に進軍する激しい戦闘の最中、マイク・オルセンという名...

アンコウの調理法

アンコウは実は深海魚です。ゼラチンが比較的豊富に含まれているため、私たちの健康に大きな役割を果たしま...

ニベの調理方法

誰でも年をとります。臓器や歯が以前ほど良くないことに気づいたら、食生活の調整にもっと注意を払うべきで...

インテル、コストを大幅に削減し電気自動車のイノベーションを加速する新しい SoC ソリューションを発表

革新的なOLEA U310 SoCはモーター技術を簡素化し、電気自動車の設計と製造コストを削減します...