PPTデザイナーの私は、AIのせいで止まらなくなってしまった

PPTデザイナーの私は、AIのせいで止まらなくなってしまった

2024年春節祝典では、任素曦の温かく愛情あふれる歌声に伴って、全国の人々が春節祝典初のAIビデオを鑑賞した。 「窓からおとぎ話を眺めると、輝く雲の下、夜風が彼女の銀色の髪をそっと吹き抜け、彼は微笑みながら彼女が一緒にゆっくりと家に帰るのを待つ」この音楽では、音楽に合わせて踊る男女が青春から老年期へと歩んでいる。

2024年中国中央テレビ春節ガラ

この感動的なプログラムの背後には、1 か月以内の期限とミスの許されない非常に困難な依頼があることを知る人はほとんどいません。

そして、 AIはこの一見「不可能」と思われるタスクを達成しました

生成型人工知能技術の急速な発展により、人工知能と人間の協力はかつてないほど深く広くなりました。 AI はもはや SF 映画の中で抽象的に語られるだけのものではなく、すでに私たちの仕事や生活に静かに変化をもたらし始めています。これを踏まえ、中国科学普及協会は、AIGCに関連するあらゆることについて業界関係者と話し合う一連のインタビューを開始しました。

春節祝賀公演「光を枕にする彼女」でのAIデュエットダンスがどのように実現されたのか気になりますか? AI はデザイナーにどのような力を与えるのでしょうか?このビデオの背後にいる PPT デザイナーである Awen が、私たちとの会話の中で自身の経験を共有してくれました。

同氏は次のように語った。「初めて AI を使用したときは、このような状況になるとは想像もしていませんでした。基本的に AI なしでは生きていけません。」

以下は、Awen との会話の要約です。

ギャラリー内の画像は著作権で保護されています。転載して使用すると著作権侵害の恐れがあります。

AIが私の仕事の一部になった経緯

Q:あなたの仕事について簡単に紹介していただけますか?

Awen: 私の主な仕事は、記者会見用の PPT デザイナーです。私は北京にPPTを専門とするデザインスタジオを持っています。私もAIアーティストです。

Q: AIGCに注目し始めたのはいつですか?

Awen: AIに注目し始めたのは2022年4月です。私はWeiboをよく見るのですが、2022年4月にWeiboでDisco Diffusionというツールが流行り、周りのアーティストや仲の良い友達も使っていたんです。

Q: AIGC を試し始めたとき、AI ペイントの最大機能として何を思い描いていましたか?

アウェン:第一印象は衝撃的なものでしょうね。 2022年現在、いくつかの単語を入力するだけで画像を生成できるツールを見たことがある人はいるでしょうか?それで私はとても興奮しましたが、当時の AI 生成画像の品質はまだ非常に平均的で、十分な高解像度ではありませんでした。 DALLE-2 が発売された後、私はこのツールに対して「私たちの仕事に役立つかもしれない」と全く違う見方をしていましたが、今のような状況になるとは思ってもいませんでした。私の日々の仕事は基本的に AI と切り離せないものなのです。少なくとも静止画像の領域では、AI は十分な能力を備えています。

Q: AI はどのようなことに役立ちましたか?

Awen: 現在、AI は私の仕事の非常に重要な部分であるデザイン素材の検索において最も大きな役割を果たしています。記者会見では超ワイドスクリーンのデザインがよく使われますが、ギャラリーで10メートルを超えるスクリーンは、非常に高精細で大きなサイズの映像素材を必要とするため、ほとんどありません。従来、大きなサイズの材料を合成するには、多くの手作業の時間を費やしていました。ここで、必要な素材のサイズを AI に伝える必要があります。

実際、私の主な仕事である記者会見のPPTワークフロー作成において、AIが占める割合は現在25%~30%程度と小さいです。最近、AI 転送作成にいくつか挑戦し始めましたが、ワークフロー全体の 80% ~ 90% を AI が占めています。

Q: AI の導入によりクリエイティブなアイデアは変わりますか?

アウェン:怠け者になってしまったようです。以前は、創造的な必要性が生じたとき、まずそれについて考えていました。今、私は無意識のうちに AI に入力するキーワードをいくつか入力するかもしれません。まるで、強力な助手が加わったような感じです

Q: AI から取得した画像を手動で修正する必要がありますか?

Awen: 当初は、AI マテリアルを PS にインポートして「修正」する必要がありましたが、現在は基本的に 1 回で完了し、ほとんど変更する必要がありません。

Q: PPT 作成に AI ツールを試したことがありますか?

Awen: 実際、当社のプロの PPT デザイナーは、この種のツールによって生み出される効果をあまり高く評価しておらず、使用していません。これは、オフィスワーカーが上司とやり取りするための作業報告書テンプレートのようなものです。

Q: AI ロトスコープを始めたのはいつですか?

阿文:今年の初めに、私と海欣先生は春節祭プログラムチームから依頼を受けました。任素曦が「灯台に座る女」を歌うと、大スクリーンにデュエットダンス映像が背景映像としてステージ上に映し出され、若者から老年期まで音楽に合わせて踊るカップルを表現した。制作サイクルが1か月未満と非常に短かったため、従来の方法を使用すると、2人のダンサーのモーションキャプチャスキャンとモデリングに多くの時間がかかってしまいます。当時、春節祝祭プログラムチームは、AI を活用して、非常に短い期間で「悪くない」効果を生み出すことができるかどうか試してみることを考えました。ついにやりました。

Q:これは具体的にどのように実現されるのでしょうか?

Awen: プロジェクトの実施中に多くの課題に直面しました。

たとえば、キャラクターの安定性の問題。この番組は、結婚、結婚後、老後の3段階の女装デュエットとして設計されています。スムーズな変革を実現するために AI を活用することが重要な要件です。デュエットが難しい理由は、AIが2人のキャラクター間の特性を混同してしまうため、性別が入れ替わってしまうなどの問題が頻繁に起こるからです。私たちはさまざまな方法を試し、最終的に ControlNet タイル モデルを使用して文字の特性を修正することでこの問題を解決しました。

もう一つの例は磁器素材の実現です。 SDXL と Civitai のオープンソース モデルと LoRa のサポートにより、私たちはすぐに白磁で作られた踊るフィギュアを選ぶことにしました。しかし、その過程で多くの問題に遭遇しました。 SD1.5 の磁器 LoRa をトレーニングする必要があると考えていたところ、「キーワード」を使用するとマテリアルの問題を解決できることが分かりました。キーワードに加えて、IP-Adapter と呼ばれるプラグインも見つかりました。これは、参照画像を使用して AI に特定のマテリアル効果を生成するよう指示することができます。

もう一つの課題は、衣装変更の安定性テストでした。まず、PR でクリップを整列させ、生成中にプロンプ​​ト トラベル (異なるキーフレームが異なるコンテンツを記述) を使用し、プログラム チームが満足する結果を達成しました。

AIのビジョン

Q:現在の AI 生成画像には改善の余地がありますか?

Awen: AI で生成された画像は限界に達していると思います。

Q:想像の限界に達しましたか?

Awen: とにかく、ランダムに 2 枚の写真を目の前に置いても、どちらが AI (生成) で、どちらが実際の人間が作成したものかはわからないかもしれません。

AIが発達すればするほど、違いがわからなくなってきます。私たちの専門分野のデザイナーも同様です。つまり、一般の人々にとって、AI の絵の品質はすでに十分であり、AI の絵画は次のレベルに到達しています。実際、私たちのグループは AI の開発に関して最も傲慢です。当初、私たちのほとんどは AI が生成した画像を軽蔑していました。 「AI が、私たちが自分でデザインしたり描いたりしたものとどう比較できるだろうか?」と私は考えました。しかし、作業を進めていくうちに、AI 生成の品質がどんどん向上していることに気づきました。試してみると、使い続けることをやめられなくなり、作業負荷が本当に軽減され、効率も上がりました。それから私はゆっくりと黙りました。

しかし、あえて言うなら、テキストベースのグラフ モデルが「人間の言語」をよりよく理解できるように、ChatGPT などの大規模テキスト モデルの機能と組み合わせる必要があります。

今では、AI 転送を増やして、より油絵のようなスタイルを作成しています。たとえば、上海の街の風景をゴッホの有名な絵画のワンシーンに変えるなどです。

Q: AI で置き換えられる仕事と、置き換えられない仕事は何ですか?

Awen: 反復的な労働は確実に置き換えられるでしょう。たとえば、あなたの以前の仕事が毎日写真を切り抜くことなど、創造性とはまったく関係のない作業だったとしたら、あなたは間違いなく代わりの人を雇うことになるでしょう。何かを置き換えることができないのであれば、それは創造性などのよりソフトな能力であるに違いありません。こういった仕事はかけがえのないものであり、取り組めば取り組むほど、個人の美的嗜好に左右されるものだと感じています。コンテンツやデザインに対する個人的な美的嗜好はすべて、最終的な画像作品に影響します。現時点では、AIはランダムにインスピレーションをもたらすことしかできませんが、人間は主観的に独自の美学を出力することができ、それはかけがえのないものです。

私は興味深い現象を観察しました。 2年前、一部の部外者が画家やゲーム原作者、デザイナーらを「もうすぐ失業するだろう」と挑発した。しかし、2年後には、OPENART コミュニティのトップ 10 のほとんどがゲーム アーティストやデザイナーであることがわかります。 AIペインティングはついにピラミッドの頂点に登りつめましたが、その頂点には依然としてプロフェッショナルたちが立っていました。

Q: AIGC 実践者へのアドバイスはありますか?

アウェン:置いていかれることをあまり心配しすぎないで。この世界では毎日新しいテクノロジーが生まれています。過去 6 か月間の私の観察に基づくと、効率的な方法は、全員が試してみるまで待ってから、漏れを見つけ出し、最も効果的なツールをテストすることです。これが最善の方法です。

Q: AIは新しい仕事を生み出すことができると思いますか?

Awen: 間違いなくあるでしょう。しかし、現在、AIを多く活用しているのは、転職した従来のデザイナーたちです。

Q: AIの将来的な限界は人間と同じになると思いますか?それとも、AI は別の方向へ発展するのでしょうか?

Awen: AI の知識の蓄積だけでも全人類の知識をはるかに上回っているので、AI は人間を超えると思います。それは人類の知識の総和であるかもしれません。鍵となるのは、AI が知識をどのように活用するかという点です。 AIが人間を超えるのは時間の問題だと思います。

Q:あなたが発見した AIGC の面白い遊び方をいくつかお勧めいただけますか?

Awen: 私がこれまで使用した中で最高の AI 翻訳プラグインは Immersive Translation です。これは、ワンクリックですべての外国語の Web コンテンツをバイリンガル翻訳に変換できます。大規模な言語モデルに基づいているため、翻訳は非常に正確です。また、コードの知識がなくても Web サイトやアプリケーションを作成できるため、プログラミング初心者の方には cursor を試してみることをお勧めします。さらに、AIGC を深く探求したい友人に、初心者が使用すべき AI ツールである comfyUI を共有したいと思います。使い始めると、すべてのオープンソース テクノロジがプラグインになります。

Q:他に何か伝えたいことはありますか?

アウェン:中国のAI分野における成果は実に印象的で強力だと申し上げたいと思います。世界中で、メディアは大手外国企業のモデリング能力を過度に誇張し、地味ながらも輝かしい中国のチームを無視してきました。

実際、オープンソース コミュニティでは、少なくとも AI ペインティングと AI ビデオの分野では、KeLing は言うまでもなく、LCM、AnimateDiff、instantID、IPadapter、LivePortrait など、コンポーネントの 90% が中国または中国のチームによって作成されています。実際、海外のオープンソースコミュニティは中国のチームを非常に尊敬していますが、中国のチームは常に控えめで、中国で話題になることはめったにないため、中国のAI技術は良くなく、外国に勝てないと常に多くの人が考えています。実際、私の意見では、これは全く当てはまりません。

企画・制作

著者丨東鼎ウーロン 人気科学クリエイター

インタビュー対象者: Simon Awen、AbleSlide 共同創設者、AI アーティスト

レビュー丨テンセント玄武ラボの責任者、Yu Yang氏

企画丨Lin Lin

編集者:何童

校正:徐来林

<<:  最新のニュースとしては、私たちの近親者がすでに箸で麺類を食べているということです!

>>:  「ワイルドロボット」は劇場で公開中です!母性愛は、プログラミングの「牢獄」をどうやって突破できるのでしょうか?

推薦する

エイリアンのテクノロジータワー?ああ、それは人工の太陽熱発電所だった

制作:中国科学普及協会著者: ハンム・ディアオメン (ポピュラーサイエンスクリエイター)プロデューサ...

春雨ベビーキャベツの作り方

ベビーキャベツは白菜の一種ですが、白菜よりもずっと小さいので、ミニ白菜とも呼ばれています。ベビーキャ...

Microsoft Edgeブラウザはハッカーから「柔らかい柿」と認識されている:セキュリティは最下位

Microsoft は、Edge ブラウザにさらに多くの新機能と最適化を提供し、初めてサードパーティ...

4G にアップグレードした後、どの携帯電話のインターネット速度が最も速くなりますか?

もちろんXiaomiの携帯ではありません。雷軍の過去2年間のスローガンは「熱狂的な携帯電話」であった...

歯固めビスケットの作り方

子どもの身体の健康は、親が最も心配する問題です。子どもは歯が生え変わる時期になると、歯ぎしりをする傾...

夏に冷たいものを食べるときは、この10のポイントに注意してください

冷凍食品は、特に夏場、ホワイトカラー労働者の生活の中で非常に一般的になっています。冷凍すると細菌の増...

主流のグラフィックカード18枚の消費電力の比較:NvidiaカードがNvidiaカードを上回る

AMD Radeon RX 480 グラフィックス カードが最初にリリースされたとき、「PCI-E ...

なぜこの「1000分の1」の超重素粒子が世界中の物理学者を驚かせたのでしょうか?

||||著者:張昊(中国科学院高エネルギー物理研究所理論物理学研究室准研究員)編集者/ディン・リン...

薬を服用する際には従うべき特定のルールがあります。まだ間違った方法で薬を飲んでいますか?

間違った薬を服用すると健康上の問題を引き起こす可能性があることは誰もが知っていますが、間違った方法で...

ネットワーク全体が課題ですか?緊急リマインダー!

高いお団子ヘアと緑の服を着た女の子たちがゆっくりと歩いていた春節祭の舞台で「オンリーグリーン」が人気...

高血圧の人は豚足を食べても大丈夫ですか?

豚足は豚足とも呼ばれます。豚には4本の足があります。前の2本の足は比較的小さく、後ろの2本の足は大き...

マスタードグリーンと豆腐のスープ

からし菜と豆腐のスープはシンプルですが新鮮な味わいなので、多くの人が好んで飲んでいます。からし菜と豆...

360 モバイル フォン N4 の楽しい体験: 1,000 元以下の最高の携帯電話になり得るか?

2016年、QihooとDashengは徐々に人々に話題にされなくなり、再設計されたF、N、Qシリ...