ログインする ユーザー登録する

031:EasyWan22の基本的な使い方

前回はお試しだけでしたが、今回はEasyWan22の基本的な使い方についてです。
まずは動かしたい元画像を用意します(2枚目)。これは普通に生成AIで出力してもいいですし、手書きでも写真でもOKです。(個人的な利用ではない場合、権利関係は気を付けましょう)

EasyWan22を起動すると、ComfyUIのワークフロー画面が開きます(3枚目)。
大量に箱や線がありますが、その全部を理解しなくても動画は生成できますので、大丈夫です。
ワークフローの中から、「StartImage」と書かれた「ノード」を探します。ノードというのは緑色や茶色をした四角い箱のような表示のもので、それぞれ画像や動画を生成するための役割と設定値を持っています。
「StartImage」は茶色の箱で、そこに何らかの画像をドラッグ&ドロップすると動画の元画像として設定されます。
(左側の黄色い〇の部分が「StartImage」のノード)

なお、EasyWan22では主に茶色のノードに設定をするだけで、基本的な使い方はできるように組まれています。
設定をカスタマイズする場合でも、緑色のノードを触るくらいで良いように、整理してくださってます。

次に、今度は「PositiveInput」のノードを探します(右側の黄色い〇の部分が「PositiveInput」のノード)。
ここにどういう動画にしたいかの説明を入力します。EasyWan22の場合、ここの入力は日本語の自然文でOKです。
いろいろ試したところ、SD1.5系やSDXL系の画像生成と異なり、タグの羅列を入力するよりは、自然文で単語と単語の関係性を明示する方が、意図に近い結果を得ることができるようです。
また、日本語よりは英語や中国語で入力する方が文意通りの結果になりやすいようです。ここは学習量の差だと思います(Wan2.2は中国発のAIモデルという事情から)。
もし英語や中国語でテキストを入力したい場合は、Google翻訳などを用いるといいようです。
ちなみに、EasyWan22では翻訳機能のノードも用意されているので、自動で翻訳したテキストをプロンプトとして使ってもらうこともできます。

元画像とプロンプトをセットした状態で、3枚目の右下の再生ボタンを押下すると、動画の生成が始まります。
パソコンの性能や生成する動画の縦横サイズによりますが、3秒くらいの長さの動画が1分程度で生成される感じです。
今回生成してみたものが1枚目の動画です。

また、動画を生成した際に、合わせてEndFrameも静止画webpファイルとして出力されます(4枚目)。
これを5枚目のように、今度は「StartImage」ノードにセットして動画を生成することで、続きを出力させることができます。
ただ、何度も生成させているとだんだん絵柄がある一定の方向に寄って行くのと、なぜか色合いが濃い目の高彩度にシフトしていくクセがあるようなので、何度も繰り返しEndFrame指定生成するのは微妙なのですが…。

Muaccaさんの他の投稿

Muaccaさんの他の投稿

すべてを見る
036:Qwen Image Edit の使い方
6

036:Qwen Image Edit の使い方

全体公開

今回は、元画像からテキスト指示で画像を編集できるQwen Image Editを試してみました。 例によって、差分の画像をStart-Endにフレーム指定して動画を作るのに便利、という動機からです。 まずは元画像としていつものようにAnim4gineで画像を用意します(2枚目)。 これを3枚目の画像のようにしてQwen Image Editのワークフローにセットします。 プロンプトとしては、「背景だけをフォトリアルな森の画像に差し替えてください」みたいな自然文をgoogle翻訳で英語にしたものを使ってみました(4枚目)。 今度は4枚目の画像を元にして、「キャラクターを削除して背景だけにしてください」とすると、5枚目のような森の風景だけの画像になりました。消しゴムマジックみたいなことができますね。 さらに「キャラクターを削除するけど、線画だけは残してくれ」としてみたのが6枚目で、そこから「背景を夜にして、線画を光らせてくれ」としたのが1枚目、といった感じです。 nano bananaほど指示がきれいに反映されるというわけではなく、融通が利かないところもあるんですが、これをローカルのPCで使い放題というのは結構楽しいです。 いろいろ試してみたくなりますね。

035:Anytestの使い方
6

035:Anytestの使い方

全体公開

Wan2.2で動画を作るときにはポーズ差分の画像があるとStart-Endでフレーム指定で安定した動画が生成できるので、最近はポーズ差分画像をどう作るかをいろいろ試しています。 nano bananaは強力なのですが、制約があったり絵柄がnano banana絵柄に寄ったりするので他の手段も試している、というか。 私がメインで使っている画像生成モデルはAnimagine4なので、Controlnetでポーズ指定するという手が使えます。 SDXL系のControlnetとしてはAnytestという強力なブツがあるので、それを試してみました。 まずは2枚目のような、大雑把な構図指定画像を手描きします。これはClip Studio Paintでマウスでちょいちょいと5分程度で描いた代物で、「まあなんとなく言いたいことは分かる」レベルのものかな、と思います。 この構図指定画像を参照画像として設定しているのが3枚目の画像で、Anytestを使うためのComfyUIワークフローです。このワークフローで画像を生成したのが1枚目です。なんとなくそれっぽくはなっている気がしますね。 ↓プロンプトはこんな感じにしています。 1girl, _, from _, blonde long hair, blue eyes tareme, forehead, pointy ears large breast, groin tendon slim bod, single-shoulder long magical black robe, bra strap, mini skirt under robe frill skirt, contrapposto, water wave background, smile, (glitter magic circle effect:1.2) from hand, blue water effect, pure clear realistic water, splash water around wind blowing さて、Anytestですが、結構いろいろなことができる「万能Controlnet」と言われていて、例えば4枚目の画像の真ん中の部分を黒塗りでつぶして(5枚目)これを参照画像として渡すと、1枚目の画像のポーズを変更することができたりもします(6枚目)。 1枚目の画像と6枚目の画像を動画のStart-Endフレームに指定すれば、なんとなく水魔法を使っているエルフ姉さんの動画ができるような気がしますね! とまあこんな感じに便利なControlnet「Anytest」ですが、月須和さんがHuggingFaceで公開してくれています。ありがたいですね。 https://huggingface.co/2vXpSwA7

034:InfiniteTalkで読み上げ動画を作る
3

034:InfiniteTalkで読み上げ動画を作る

全体公開

前回はWan2.2のS2Vモデルを使って、セリフ音声と画像から、読み上げ動画を作りましたが、今回はセリフ音声と動画から、読み上げ動画を作ってみます。 前回のはWan2.2 S2Vで1枚の画像から動画を生成したのですが、口元以外の箇所はあまり動かないというか、ほぼ口パク動画、みたいな感じでした。 今回は人物がなにか動いている動画をもとに、口元をセリフに合わせて口パクさせるというもので、動きのある読み上げ動画を作る場合はこちらの方が良いようです。 こういった手法はVideo to Video(V2V)と呼ばれているようですね。 読み上げのためのV2VにはInfiniteTalkを用いてみました。 InfiniteTalkはまだWan2.2には対応していないので、Wan2.1と組み合わせて使ってみています。 2枚目の画像がInfiniteTalkを使うためのComfyUIのワークフローで、画面下の方で元となる動画(1枚目)を指定しています。 セリフ音声は上の方(音声を読み込む、のところ)に指定してみています。 3枚目もワークフローの一部で、真ん中のあたりにプロンプトを指定しています。この手法の場合、キャラクターの見た目も動きも動画で指定しているので、プロンプトは簡単に「The woman turns to me, stretches her body, and speaks with a smile.」(その女性は私の方を向き、体を伸ばして、笑顔で話します)としました。 あとは実行すると、セリフ音声に合わせて口元の動きが調整されます。

033:Wan22 S2Vで読み上げ動画を作る
3

033:Wan22 S2Vで読み上げ動画を作る

全体公開

今回はWan2.2のS2Vモデルを使って、セリフ音声と画像から、読み上げ動画を作ってみました。 S2Vは、音声からそれに合った動画を生成するものですが、元画像を指定するとそれをもとにI2Vのように画像に沿った動画を生成してくれます。 前回使った魔法少女画像の顔アップ(2枚目)を元画像に指定し、音声として「魔法少女Muacca、いつもみんなと楽しく、ですです」という読み上げ音声を指定してできたのが1枚目の動画です。 残念ながらちちぷいには音声付の動画は投稿できないので、口パクだけになってしまいますが、元画像のキャラがなにかしゃべっている感じになっているのは分かるかと思います。 Wan2.2 S2Vですが、UIとしては公式から配布されているComfyUIワークフローを用いて実行しました(3枚目)。 基本的にはデフォルト値のままで使うのがいいようです。 ちなみに16fpsが指定されているのですが、これを30fpsとかにすると音声と口パクがズレるので、変えないほうが良いようです。fpsを変更したい場合は、生成した動画を別のツールでフレーム補間すればよいと思います。 あと、公式の情報では生成される動画は77フレーム分と書いてあって、これは変更しないほうが良いとのことでした。16fpsだと4秒くらいの動画になるはずなのですが、結果として生成されたのは14秒くらいのものだったので、それがなぜなのかはよくわかりません。投入した音声は4秒くらいだったので、ここに投稿しているものは後ろの無音声部分をカットしてあります。

他のクリエイターの投稿

機械仕掛けの守護天使
11

機械仕掛けの守護天使

580コイン/月以上支援すると見ることができます

ロカイユ
6

ロカイユ

全体公開

透明感
13

透明感

580コイン/月以上支援すると見ることができます

サイドポニーECHIDNAことかちゃん
3

サイドポニーECHIDNAことかちゃん

全体公開

ちちぷいちゃんの日常
4

ちちぷいちゃんの日常

100コイン/月以上支援すると見ることができます

氷月抜刀術
14

氷月抜刀術

580コイン/月以上支援すると見ることができます

レオタード少女194~200
7

レオタード少女194~200

100コイン/月以上支援すると見ることができます

20260130【5枚】アイドルステージ衣装の女性
5

20260130【5枚】アイドルステージ衣装の女性

200コイン/月以上支援すると見ることができます

「反応がもらえない…」を卒業するちちぷい戦略

「反応がもらえない…」を卒業するちちぷい戦略

100コイン/月以上支援すると見ることができます

版画街
6

版画街

全体公開

ゆるゆるファーストテイク。
13

ゆるゆるファーストテイク。

580コイン/月以上支援すると見ることができます

ダブルピース

ダブルピース

100コイン/月以上支援すると見ることができます

ペンギン🐧✨

ペンギン🐧✨

500コイン/月以上支援すると見ることができます

美m010
31

美m010

全体公開

過去作、SD1.5で生成したものをZ-imageでi2iしてみました✨️ ヤバい!可愛すぎる😍😍 v1 美1580 https://www.chichi-pui.com/posts/e11ea262-c172-4c84-abe6-279aa47ea69d/ v2 美1581 https://www.chichi-pui.com/posts/7a4f655f-444f-4af9-a7c4-08b2a1334643/

漫画風アクション メカ娘バージョン
18

漫画風アクション メカ娘バージョン

580コイン/月以上支援すると見ることができます

20260124【5枚】ブラウンチェック柄ドレスと眼鏡の女性
5

20260124【5枚】ブラウンチェック柄ドレスと眼鏡の女性

200コイン/月以上支援すると見ることができます