PPTデザイナーの私は、AIのせいで止まらなくなってしまった

PPTデザイナーの私は、AIのせいで止まらなくなってしまった

2024年春節祝典では、任素曦の温かく愛情あふれる歌声に伴って、全国の人々が春節祝典初のAIビデオを鑑賞した。 「窓からおとぎ話を眺めると、輝く雲の下、夜風が彼女の銀色の髪をそっと吹き抜け、彼は微笑みながら彼女が一緒にゆっくりと家に帰るのを待つ」この音楽では、音楽に合わせて踊る男女が青春から老年期へと歩んでいる。

2024年中国中央テレビ春節ガラ

この感動的なプログラムの背後には、1 か月以内の期限とミスの許されない非常に困難な依頼があることを知る人はほとんどいません。

そして、 AIはこの一見「不可能」と思われるタスクを達成しました

生成型人工知能技術の急速な発展により、人工知能と人間の協力はかつてないほど深く広くなりました。 AI はもはや SF 映画の中で抽象的に語られるだけのものではなく、すでに私たちの仕事や生活に静かに変化をもたらし始めています。これを踏まえ、中国科学普及協会は、AIGCに関連するあらゆることについて業界関係者と話し合う一連のインタビューを開始しました。

春節祝賀公演「光を枕にする彼女」でのAIデュエットダンスがどのように実現されたのか気になりますか? AI はデザイナーにどのような力を与えるのでしょうか?このビデオの背後にいる PPT デザイナーである Awen が、私たちとの会話の中で自身の経験を共有してくれました。

同氏は次のように語った。「初めて AI を使用したときは、このような状況になるとは想像もしていませんでした。基本的に AI なしでは生きていけません。」

以下は、Awen との会話の要約です。

ギャラリー内の画像は著作権で保護されています。転載して使用すると著作権侵害の恐れがあります。

AIが私の仕事の一部になった経緯

Q:あなたの仕事について簡単に紹介していただけますか?

Awen: 私の主な仕事は、記者会見用の PPT デザイナーです。私は北京にPPTを専門とするデザインスタジオを持っています。私もAIアーティストです。

Q: AIGCに注目し始めたのはいつですか?

Awen: AIに注目し始めたのは2022年4月です。私はWeiboをよく見るのですが、2022年4月にWeiboでDisco Diffusionというツールが流行り、周りのアーティストや仲の良い友達も使っていたんです。

Q: AIGC を試し始めたとき、AI ペイントの最大機能として何を思い描いていましたか?

アウェン:第一印象は衝撃的なものでしょうね。 2022年現在、いくつかの単語を入力するだけで画像を生成できるツールを見たことがある人はいるでしょうか?それで私はとても興奮しましたが、当時の AI 生成画像の品質はまだ非常に平均的で、十分な高解像度ではありませんでした。 DALLE-2 が発売された後、私はこのツールに対して「私たちの仕事に役立つかもしれない」と全く違う見方をしていましたが、今のような状況になるとは思ってもいませんでした。私の日々の仕事は基本的に AI と切り離せないものなのです。少なくとも静止画像の領域では、AI は十分な能力を備えています。

Q: AI はどのようなことに役立ちましたか?

Awen: 現在、AI は私の仕事の非常に重要な部分であるデザイン素材の検索において最も大きな役割を果たしています。記者会見では超ワイドスクリーンのデザインがよく使われますが、ギャラリーで10メートルを超えるスクリーンは、非常に高精細で大きなサイズの映像素材を必要とするため、ほとんどありません。従来、大きなサイズの材料を合成するには、多くの手作業の時間を費やしていました。ここで、必要な素材のサイズを AI に伝える必要があります。

実際、私の主な仕事である記者会見のPPTワークフロー作成において、AIが占める割合は現在25%~30%程度と小さいです。最近、AI 転送作成にいくつか挑戦し始めましたが、ワークフロー全体の 80% ~ 90% を AI が占めています。

Q: AI の導入によりクリエイティブなアイデアは変わりますか?

アウェン:怠け者になってしまったようです。以前は、創造的な必要性が生じたとき、まずそれについて考えていました。今、私は無意識のうちに AI に入力するキーワードをいくつか入力するかもしれません。まるで、強力な助手が加わったような感じです

Q: AI から取得した画像を手動で修正する必要がありますか?

Awen: 当初は、AI マテリアルを PS にインポートして「修正」する必要がありましたが、現在は基本的に 1 回で完了し、ほとんど変更する必要がありません。

Q: PPT 作成に AI ツールを試したことがありますか?

Awen: 実際、当社のプロの PPT デザイナーは、この種のツールによって生み出される効果をあまり高く評価しておらず、使用していません。これは、オフィスワーカーが上司とやり取りするための作業報告書テンプレートのようなものです。

Q: AI ロトスコープを始めたのはいつですか?

阿文:今年の初めに、私と海欣先生は春節祭プログラムチームから依頼を受けました。任素曦が「灯台に座る女」を歌うと、大スクリーンにデュエットダンス映像が背景映像としてステージ上に映し出され、若者から老年期まで音楽に合わせて踊るカップルを表現した。制作サイクルが1か月未満と非常に短かったため、従来の方法を使用すると、2人のダンサーのモーションキャプチャスキャンとモデリングに多くの時間がかかってしまいます。当時、春節祝祭プログラムチームは、AI を活用して、非常に短い期間で「悪くない」効果を生み出すことができるかどうか試してみることを考えました。ついにやりました。

Q:これは具体的にどのように実現されるのでしょうか?

Awen: プロジェクトの実施中に多くの課題に直面しました。

たとえば、キャラクターの安定性の問題。この番組は、結婚、結婚後、老後の3段階の女装デュエットとして設計されています。スムーズな変革を実現するために AI を活用することが重要な要件です。デュエットが難しい理由は、AIが2人のキャラクター間の特性を混同してしまうため、性別が入れ替わってしまうなどの問題が頻繁に起こるからです。私たちはさまざまな方法を試し、最終的に ControlNet タイル モデルを使用して文字の特性を修正することでこの問題を解決しました。

もう一つの例は磁器素材の実現です。 SDXL と Civitai のオープンソース モデルと LoRa のサポートにより、私たちはすぐに白磁で作られた踊るフィギュアを選ぶことにしました。しかし、その過程で多くの問題に遭遇しました。 SD1.5 の磁器 LoRa をトレーニングする必要があると考えていたところ、「キーワード」を使用するとマテリアルの問題を解決できることが分かりました。キーワードに加えて、IP-Adapter と呼ばれるプラグインも見つかりました。これは、参照画像を使用して AI に特定のマテリアル効果を生成するよう指示することができます。

もう一つの課題は、衣装変更の安定性テストでした。まず、PR でクリップを整列させ、生成中にプロンプ​​ト トラベル (異なるキーフレームが異なるコンテンツを記述) を使用し、プログラム チームが満足する結果を達成しました。

AIのビジョン

Q:現在の AI 生成画像には改善の余地がありますか?

Awen: AI で生成された画像は限界に達していると思います。

Q:想像の限界に達しましたか?

Awen: とにかく、ランダムに 2 枚の写真を目の前に置いても、どちらが AI (生成) で、どちらが実際の人間が作成したものかはわからないかもしれません。

AIが発達すればするほど、違いがわからなくなってきます。私たちの専門分野のデザイナーも同様です。つまり、一般の人々にとって、AI の絵の品質はすでに十分であり、AI の絵画は次のレベルに到達しています。実際、私たちのグループは AI の開発に関して最も傲慢です。当初、私たちのほとんどは AI が生成した画像を軽蔑していました。 「AI が、私たちが自分でデザインしたり描いたりしたものとどう比較できるだろうか?」と私は考えました。しかし、作業を進めていくうちに、AI 生成の品質がどんどん向上していることに気づきました。試してみると、使い続けることをやめられなくなり、作業負荷が本当に軽減され、効率も上がりました。それから私はゆっくりと黙りました。

しかし、あえて言うなら、テキストベースのグラフ モデルが「人間の言語」をよりよく理解できるように、ChatGPT などの大規模テキスト モデルの機能と組み合わせる必要があります。

今では、AI 転送を増やして、より油絵のようなスタイルを作成しています。たとえば、上海の街の風景をゴッホの有名な絵画のワンシーンに変えるなどです。

Q: AI で置き換えられる仕事と、置き換えられない仕事は何ですか?

Awen: 反復的な労働は確実に置き換えられるでしょう。たとえば、あなたの以前の仕事が毎日写真を切り抜くことなど、創造性とはまったく関係のない作業だったとしたら、あなたは間違いなく代わりの人を雇うことになるでしょう。何かを置き換えることができないのであれば、それは創造性などのよりソフトな能力であるに違いありません。こういった仕事はかけがえのないものであり、取り組めば取り組むほど、個人の美的嗜好に左右されるものだと感じています。コンテンツやデザインに対する個人的な美的嗜好はすべて、最終的な画像作品に影響します。現時点では、AIはランダムにインスピレーションをもたらすことしかできませんが、人間は主観的に独自の美学を出力することができ、それはかけがえのないものです。

私は興味深い現象を観察しました。 2年前、一部の部外者が画家やゲーム原作者、デザイナーらを「もうすぐ失業するだろう」と挑発した。しかし、2年後には、OPENART コミュニティのトップ 10 のほとんどがゲーム アーティストやデザイナーであることがわかります。 AIペインティングはついにピラミッドの頂点に登りつめましたが、その頂点には依然としてプロフェッショナルたちが立っていました。

Q: AIGC 実践者へのアドバイスはありますか?

アウェン:置いていかれることをあまり心配しすぎないで。この世界では毎日新しいテクノロジーが生まれています。過去 6 か月間の私の観察に基づくと、効率的な方法は、全員が試してみるまで待ってから、漏れを見つけ出し、最も効果的なツールをテストすることです。これが最善の方法です。

Q: AIは新しい仕事を生み出すことができると思いますか?

Awen: 間違いなくあるでしょう。しかし、現在、AIを多く活用しているのは、転職した従来のデザイナーたちです。

Q: AIの将来的な限界は人間と同じになると思いますか?それとも、AI は別の方向へ発展するのでしょうか?

Awen: AI の知識の蓄積だけでも全人類の知識をはるかに上回っているので、AI は人間を超えると思います。それは人類の知識の総和であるかもしれません。鍵となるのは、AI が知識をどのように活用するかという点です。 AIが人間を超えるのは時間の問題だと思います。

Q:あなたが発見した AIGC の面白い遊び方をいくつかお勧めいただけますか?

Awen: 私がこれまで使用した中で最高の AI 翻訳プラグインは Immersive Translation です。これは、ワンクリックですべての外国語の Web コンテンツをバイリンガル翻訳に変換できます。大規模な言語モデルに基づいているため、翻訳は非常に正確です。また、コードの知識がなくても Web サイトやアプリケーションを作成できるため、プログラミング初心者の方には cursor を試してみることをお勧めします。さらに、AIGC を深く探求したい友人に、初心者が使用すべき AI ツールである comfyUI を共有したいと思います。使い始めると、すべてのオープンソース テクノロジがプラグインになります。

Q:他に何か伝えたいことはありますか?

アウェン:中国のAI分野における成果は実に印象的で強力だと申し上げたいと思います。世界中で、メディアは大手外国企業のモデリング能力を過度に誇張し、地味ながらも輝かしい中国のチームを無視してきました。

実際、オープンソース コミュニティでは、少なくとも AI ペインティングと AI ビデオの分野では、KeLing は言うまでもなく、LCM、AnimateDiff、instantID、IPadapter、LivePortrait など、コンポーネントの 90% が中国または中国のチームによって作成されています。実際、海外のオープンソースコミュニティは中国のチームを非常に尊敬していますが、中国のチームは常に控えめで、中国で話題になることはめったにないため、中国のAI技術は良くなく、外国に勝てないと常に多くの人が考えています。実際、私の意見では、これは全く当てはまりません。

企画・制作

著者丨東鼎ウーロン 人気科学クリエイター

インタビュー対象者: Simon Awen、AbleSlide 共同創設者、AI アーティスト

レビュー丨テンセント玄武ラボの責任者、Yu Yang氏

企画丨Lin Lin

編集者:何童

校正:徐来林

<<:  最新のニュースとしては、私たちの近親者がすでに箸で麺類を食べているということです!

>>:  「ワイルドロボット」は劇場で公開中です!母性愛は、プログラミングの「牢獄」をどうやって突破できるのでしょうか?

推薦する

海の星、貝殻の美しさ

誰かが言いました。「海には空の星の数と同じくらい多くの貝殻がある。」それは正しい!空の星のように、海...

耐久性のジレンマに直面したテスラの長期主義は、国内の新興勢力にさらなる圧力をかけることになるだろう

半年の延期を経て、テスラの「バッテリーカンファレンス」が数日前にようやく開催された。マスク氏は会議で...

Roewe RX5、超大型パノラマサンルーフと1Gデータを無料でアップグレード

最近、インターネットカーの新カテゴリー「着陸・探索」の1周年を記念して、Roewe RX5 20Tの...

9ヶ月の離乳食

生後 9 か月の赤ちゃんは、補助食品を食べることができます。母乳だけを食べたり、粉ミルクだけを飲んだ...

食品ピラミッド

食事ピラミッドは主に人々の生活習慣と食習慣に基づいています。私たちはピラミッドモデルをよく理解する必...

SFで語られなかった真実?実際の流浪地球には、実にたくさんの核爆弾が必要なのです。

地球は太陽系から離脱できるのか?これはどのように行うべきでしょうか?地球と天の川のコラージュ。 (写...

殻がなくてもひよこが孵るというのは本当ですか?

昨日は「卵生動物の殻を破る方法」についてお話ししましたが、その中で「殻のない鶏の胚は殻をつつく必要が...

IDC: 世界のスマートカメラ市場の出荷台数は2024年に1億3,700万台に達し、前年比7.7%増となる見込み

最近、インターナショナル・データ・コーポレーション(IDC)が発表したデータによると、世界のスマート...

ヒーリングスピーカーとは?あなたの気分を感じ取ることができます

光と音楽が人間の感情に大きな影響を与えることは誰もが知っています。たとえば、青は人を落ち込ませ、赤は...

テスラは「構成の縮小」スキャンダルに巻き込まれる: スピードは成功の鍵であり、スピードは失敗の鍵でもある!

創業者の性格によるものなのか、あるいは市場を素早く掌握するためなのかはわかりませんが、テスラの製品改...

Pseudostellaria heterophyllaの副作用

薬草の「オオバコ」といえば、多くの人が知っていると思います。 Pseudostellaria het...

休暇後に仕事の効率を2倍にするにはどうすればいいでしょうか? Sogou AIボイスレコーダーC1 Proで答えをお伝えします

人工知能などの新興技術の台頭により、伝統的な産業は大きな変化を遂げています。これは、インターネットの...

有酸素運動を先に行うか、それとも抵抗運動を先に行うか?ジムで過ごすのが好きなら、それは間違っているかもしれません...

編纂者:Gong Zixinジムに行って、まずどの方向へ行きますか?トレッドミル用ですか、それともス...

野生のイチゴは食べられますか?

花が咲く春には、野いちごをよく見かけます。しかし、現代人の生活環境が改善されるにつれ、野いちごを知ら...