ログインする ユーザー登録する

013:昔出力した画像を最近のAIモデルでi2i加工してみる

ここまで紹介したFooocusのi2iで、以前に自分で出力した画像を加工してみるというのが今回の記事です。
私の場合、以前に出力した画像はたいていtwitterに投稿していて、それをposfie(旧:togetter)にまとめているので、そこから画像を持ってきて、今のAIモデルやプロンプトでi2iしてみたいと思います。

お絵描きAI「Stable Diffusion」「DALLE」などで生成した画像
https://posfie.com/@Muacca/p/CLOBbmF

いま見てみるともっとも古い投稿は2022-08-30ですね…まだ『ちちぷい』も存在していない頃です。(ちちぷい開設は確か2022-11頃)
Stable Diffusionのv1(1.3かな?)で出力している画像を使ってみましょう(2枚目)。

まずは画像を目視で見た感じから、それっぽいプロンプトを自作します。
当時のプロンプト、どこかに残しておいたと思うのですが、まあ、以前のAIモデルと今のAIモデルとだとプロンプトの効きも違うので、今回は今のAIモデルに合わせてプロンプトを組みなおしました。
stylesでの固定プロンプトを除いたベースプロンプトは以下の通りです。

16 year old elf girl profile, black hair long hair, forehead, blue eyes, half-closed eyes, pointy ears, volume lip, cleavage breast, light silk lace cloth dark-red robe, expressionless, blue splash pattern background Mucha

このプロンプトを用いてAnim4gine(+いくつかのLoRA)で生成したのが3枚目です。雰囲気は近いかな、と思います。
さて、このプロンプトを用いて、2枚目の元画像をi2iしてみましょう。

まずは単に解像度を上げるだけのアップスケール(x2)をしてみたのが4枚目です。ちょっとプロンプトに引きずられて雰囲気変わった気がしますが、まあ、だいたい元画像のまま、といってもいいでしょうかね?

次はvary(subtle)してみたのが5枚目です。元画像の構図や色味は残したまま、今風な仕上がりになっている気がしますね。
6枚目はvary(strong)したもので、絵柄が完全に今風なイラストになっています。(1枚目はこれをアップスケールしたもの)

以前に出力した画像も、ときどきこうしてi2iして遊ぶのも面白いですね。

Muaccaさんの他の投稿

Muaccaさんの他の投稿

すべてを見る
036:Qwen Image Edit の使い方
6

036:Qwen Image Edit の使い方

全体公開

今回は、元画像からテキスト指示で画像を編集できるQwen Image Editを試してみました。 例によって、差分の画像をStart-Endにフレーム指定して動画を作るのに便利、という動機からです。 まずは元画像としていつものようにAnim4gineで画像を用意します(2枚目)。 これを3枚目の画像のようにしてQwen Image Editのワークフローにセットします。 プロンプトとしては、「背景だけをフォトリアルな森の画像に差し替えてください」みたいな自然文をgoogle翻訳で英語にしたものを使ってみました(4枚目)。 今度は4枚目の画像を元にして、「キャラクターを削除して背景だけにしてください」とすると、5枚目のような森の風景だけの画像になりました。消しゴムマジックみたいなことができますね。 さらに「キャラクターを削除するけど、線画だけは残してくれ」としてみたのが6枚目で、そこから「背景を夜にして、線画を光らせてくれ」としたのが1枚目、といった感じです。 nano bananaほど指示がきれいに反映されるというわけではなく、融通が利かないところもあるんですが、これをローカルのPCで使い放題というのは結構楽しいです。 いろいろ試してみたくなりますね。

035:Anytestの使い方
6

035:Anytestの使い方

全体公開

Wan2.2で動画を作るときにはポーズ差分の画像があるとStart-Endでフレーム指定で安定した動画が生成できるので、最近はポーズ差分画像をどう作るかをいろいろ試しています。 nano bananaは強力なのですが、制約があったり絵柄がnano banana絵柄に寄ったりするので他の手段も試している、というか。 私がメインで使っている画像生成モデルはAnimagine4なので、Controlnetでポーズ指定するという手が使えます。 SDXL系のControlnetとしてはAnytestという強力なブツがあるので、それを試してみました。 まずは2枚目のような、大雑把な構図指定画像を手描きします。これはClip Studio Paintでマウスでちょいちょいと5分程度で描いた代物で、「まあなんとなく言いたいことは分かる」レベルのものかな、と思います。 この構図指定画像を参照画像として設定しているのが3枚目の画像で、Anytestを使うためのComfyUIワークフローです。このワークフローで画像を生成したのが1枚目です。なんとなくそれっぽくはなっている気がしますね。 ↓プロンプトはこんな感じにしています。 1girl, _, from _, blonde long hair, blue eyes tareme, forehead, pointy ears large breast, groin tendon slim bod, single-shoulder long magical black robe, bra strap, mini skirt under robe frill skirt, contrapposto, water wave background, smile, (glitter magic circle effect:1.2) from hand, blue water effect, pure clear realistic water, splash water around wind blowing さて、Anytestですが、結構いろいろなことができる「万能Controlnet」と言われていて、例えば4枚目の画像の真ん中の部分を黒塗りでつぶして(5枚目)これを参照画像として渡すと、1枚目の画像のポーズを変更することができたりもします(6枚目)。 1枚目の画像と6枚目の画像を動画のStart-Endフレームに指定すれば、なんとなく水魔法を使っているエルフ姉さんの動画ができるような気がしますね! とまあこんな感じに便利なControlnet「Anytest」ですが、月須和さんがHuggingFaceで公開してくれています。ありがたいですね。 https://huggingface.co/2vXpSwA7

034:InfiniteTalkで読み上げ動画を作る
3

034:InfiniteTalkで読み上げ動画を作る

全体公開

前回はWan2.2のS2Vモデルを使って、セリフ音声と画像から、読み上げ動画を作りましたが、今回はセリフ音声と動画から、読み上げ動画を作ってみます。 前回のはWan2.2 S2Vで1枚の画像から動画を生成したのですが、口元以外の箇所はあまり動かないというか、ほぼ口パク動画、みたいな感じでした。 今回は人物がなにか動いている動画をもとに、口元をセリフに合わせて口パクさせるというもので、動きのある読み上げ動画を作る場合はこちらの方が良いようです。 こういった手法はVideo to Video(V2V)と呼ばれているようですね。 読み上げのためのV2VにはInfiniteTalkを用いてみました。 InfiniteTalkはまだWan2.2には対応していないので、Wan2.1と組み合わせて使ってみています。 2枚目の画像がInfiniteTalkを使うためのComfyUIのワークフローで、画面下の方で元となる動画(1枚目)を指定しています。 セリフ音声は上の方(音声を読み込む、のところ)に指定してみています。 3枚目もワークフローの一部で、真ん中のあたりにプロンプトを指定しています。この手法の場合、キャラクターの見た目も動きも動画で指定しているので、プロンプトは簡単に「The woman turns to me, stretches her body, and speaks with a smile.」(その女性は私の方を向き、体を伸ばして、笑顔で話します)としました。 あとは実行すると、セリフ音声に合わせて口元の動きが調整されます。

033:Wan22 S2Vで読み上げ動画を作る
3

033:Wan22 S2Vで読み上げ動画を作る

全体公開

今回はWan2.2のS2Vモデルを使って、セリフ音声と画像から、読み上げ動画を作ってみました。 S2Vは、音声からそれに合った動画を生成するものですが、元画像を指定するとそれをもとにI2Vのように画像に沿った動画を生成してくれます。 前回使った魔法少女画像の顔アップ(2枚目)を元画像に指定し、音声として「魔法少女Muacca、いつもみんなと楽しく、ですです」という読み上げ音声を指定してできたのが1枚目の動画です。 残念ながらちちぷいには音声付の動画は投稿できないので、口パクだけになってしまいますが、元画像のキャラがなにかしゃべっている感じになっているのは分かるかと思います。 Wan2.2 S2Vですが、UIとしては公式から配布されているComfyUIワークフローを用いて実行しました(3枚目)。 基本的にはデフォルト値のままで使うのがいいようです。 ちなみに16fpsが指定されているのですが、これを30fpsとかにすると音声と口パクがズレるので、変えないほうが良いようです。fpsを変更したい場合は、生成した動画を別のツールでフレーム補間すればよいと思います。 あと、公式の情報では生成される動画は77フレーム分と書いてあって、これは変更しないほうが良いとのことでした。16fpsだと4秒くらいの動画になるはずなのですが、結果として生成されたのは14秒くらいのものだったので、それがなぜなのかはよくわかりません。投入した音声は4秒くらいだったので、ここに投稿しているものは後ろの無音声部分をカットしてあります。

他のクリエイターの投稿

氷爪白虎
11

氷爪白虎

580コイン/月以上支援すると見ることができます

次の曲「スローステップで」です♪
2

次の曲「スローステップで」です♪

100コイン/月以上支援すると見ることができます

春のお散歩 with BONSAI
7

春のお散歩 with BONSAI

150コイン/月以上支援すると見ることができます

キノの旅の後継を狙うステイゴールドさん
3

キノの旅の後継を狙うステイゴールドさん

全体公開

タイトルの通りです。二代目エルメスはヴィンセント・ブラックシャドウ(SeriesC)にお願いしました。

【無料キャラ①】パープルちゃん
2

【無料キャラ①】パープルちゃん

全体公開

初代無料キャラのパープルちゃん 私としては珍しい金髪以外のキャラです 無料キャラの投稿企画に応募したくて考えた子です 金髪で出すとそのままアリスになってしまうので紫髪にしました 同時期にオレンジちゃんという子も居たのですが、パープルちゃんの方が生成簡単なので選びました 【呪文】 Anime, 1girl, long hair, red eyes, Big eyes:1.5, happy smile, (purple hair), (two side up hair), (shiny wavy hair), the bow, hair between eyes, white gothic dresses, crinoline dress, (Very big rabbit ears, hairband), long-sleeves, puffy sleeves, apron dress, frilled, purple hem dress, wrist cuffs, neck ribbon, ((brooch)), ◆初期版  詳細な説明はこちらを参照 https://www.chichi-pui.com/posts/67f0a33d-3316-46ac-806b-068edb9d7c4a/ 生成したらコメント戴けると嬉しいです

なんとなく作ったスマホ壁紙2

なんとなく作ったスマホ壁紙2

200コイン/月以上支援すると見ることができます

「瓶詰の少女」紅66~70
5

「瓶詰の少女」紅66~70

100コイン/月以上支援すると見ることができます

サーベルタイガークロウ
15

サーベルタイガークロウ

580コイン/月以上支援すると見ることができます

カンフー
5

カンフー

100コイン/月以上支援すると見ることができます

変身、魔法少女 幸乃【パラパライラスト40】
40

変身、魔法少女 幸乃【パラパライラスト40】

全体公開

こちら↓の40枚版 https://www.chichi-pui.com/posts/cdcf29e0-d2f8-4102-8bec-028097f3b317/

新機能チラ見せ!#8
2

新機能チラ見せ!#8

100コイン/月以上支援すると見ることができます

魔法研究員のフィールドワークコーデ
22

魔法研究員のフィールドワークコーデ

580コイン/月以上支援すると見ることができます

「乾いた音を波打つように苦悩せよ」

「乾いた音を波打つように苦悩せよ」

全体公開

ステップとスケール かつての都市の面影を成すは 残響が示したる夢物語なのだろうか… 望むためのハッピーエンド しかし、それは 求めども夢でしかなかった 「結局は、哀しみでしかないんだよ  現実は期待通りにはいかない  期待通りにいくのは、いつだって、自らのフィルムの中でしかない」 彼女が見せたる幻影を Taskは見つめる 其れは、確かにあった歴史であり 今は、荒廃し、人も住めなかった 都市の中で生きているカルマであり、業であった。 「割り切れない、だから、歪みのだろうな」 壊すのは簡単だ だが、知るのは難しい そして、受け入れるのも ゆえに苦しく 廃都は そうした者の歪みに呼応して モノクロに染まっていく 「誰が私の中に異音を奏でましたか?」 作曲者は語る もちろん、元人間の怪異がだ Taskは、紙面協会により記された依頼を果たすべく、頁を閉じて相対す 「それはそれで、これはこれで やってかないとな」 義体化したことで人間の時と比べて悲しくなることは歪みの感情は希薄になったが、それでも尚、心の奥底ではズキと痛んでいる彼がいた。 其れは彼に残された少しばかりの善性なのだろうか…あるいは空虚に夢を見ようとする道化師なのか 何れにせよ、協会により発行されし 依頼を遂行せんことには明日は迎えられないので、Taskは本をポケットにしまって、任務を開始する 今日も空は曇り空 いつになったら晴れるのだろうか その雲は都市の人々が感じる 空虚なる現実を現してるのかもしれない。

制服など
29

制服など

350コイン/月以上支援すると見ることができます

ドラゴンナイト
16

ドラゴンナイト

580コイン/月以上支援すると見ることができます

17枚:美人OL
17

17枚:美人OL

全体公開