035:Anytestの使い方
nano bananaは強力なのですが、制約があったり絵柄がnano banana絵柄に寄ったりするので他の手段も試している、というか。
私がメインで使っている画像生成モデルはAnimagine4なので、Controlnetでポーズ指定するという手が使えます。
SDXL系のControlnetとしてはAnytestという強力なブツがあるので、それを試してみました。
まずは2枚目のような、大雑把な構図指定画像を手描きします。これはClip Studio Paintでマウスでちょいちょいと5分程度で描いた代物で、「まあなんとなく言いたいことは分かる」レベルのものかな、と思います。
この構図指定画像を参照画像として設定しているのが3枚目の画像で、Anytestを使うためのComfyUIワークフローです。このワークフローで画像を生成したのが1枚目です。なんとなくそれっぽくはなっている気がしますね。
↓プロンプトはこんな感じにしています。
1girl, _, from _, blonde long hair, blue eyes tareme, forehead, pointy ears large breast, groin tendon slim bod, single-shoulder long magical black robe, bra strap, mini skirt under robe frill skirt, contrapposto, water wave background, smile, (glitter magic circle effect:1.2) from hand, blue water effect, pure clear realistic water, splash water around wind blowing
さて、Anytestですが、結構いろいろなことができる「万能Controlnet」と言われていて、例えば4枚目の画像の真ん中の部分を黒塗りでつぶして(5枚目)これを参照画像として渡すと、1枚目の画像のポーズを変更することができたりもします(6枚目)。
1枚目の画像と6枚目の画像を動画のStart-Endフレームに指定すれば、なんとなく水魔法を使っているエルフ姉さんの動画ができるような気がしますね!
とまあこんな感じに便利なControlnet「Anytest」ですが、月須和さんがHuggingFaceで公開してくれています。ありがたいですね。
https://huggingface.co/2vXpSwA7
6
036:Qwen Image Edit の使い方
全体公開
今回は、元画像からテキスト指示で画像を編集できるQwen Image Editを試してみました。 例によって、差分の画像をStart-Endにフレーム指定して動画を作るのに便利、という動機からです。 まずは元画像としていつものようにAnim4gineで画像を用意します(2枚目)。 これを3枚目の画像のようにしてQwen Image Editのワークフローにセットします。 プロンプトとしては、「背景だけをフォトリアルな森の画像に差し替えてください」みたいな自然文をgoogle翻訳で英語にしたものを使ってみました(4枚目)。 今度は4枚目の画像を元にして、「キャラクターを削除して背景だけにしてください」とすると、5枚目のような森の風景だけの画像になりました。消しゴムマジックみたいなことができますね。 さらに「キャラクターを削除するけど、線画だけは残してくれ」としてみたのが6枚目で、そこから「背景を夜にして、線画を光らせてくれ」としたのが1枚目、といった感じです。 nano bananaほど指示がきれいに反映されるというわけではなく、融通が利かないところもあるんですが、これをローカルのPCで使い放題というのは結構楽しいです。 いろいろ試してみたくなりますね。
3
034:InfiniteTalkで読み上げ動画を作る
全体公開
前回はWan2.2のS2Vモデルを使って、セリフ音声と画像から、読み上げ動画を作りましたが、今回はセリフ音声と動画から、読み上げ動画を作ってみます。 前回のはWan2.2 S2Vで1枚の画像から動画を生成したのですが、口元以外の箇所はあまり動かないというか、ほぼ口パク動画、みたいな感じでした。 今回は人物がなにか動いている動画をもとに、口元をセリフに合わせて口パクさせるというもので、動きのある読み上げ動画を作る場合はこちらの方が良いようです。 こういった手法はVideo to Video(V2V)と呼ばれているようですね。 読み上げのためのV2VにはInfiniteTalkを用いてみました。 InfiniteTalkはまだWan2.2には対応していないので、Wan2.1と組み合わせて使ってみています。 2枚目の画像がInfiniteTalkを使うためのComfyUIのワークフローで、画面下の方で元となる動画(1枚目)を指定しています。 セリフ音声は上の方(音声を読み込む、のところ)に指定してみています。 3枚目もワークフローの一部で、真ん中のあたりにプロンプトを指定しています。この手法の場合、キャラクターの見た目も動きも動画で指定しているので、プロンプトは簡単に「The woman turns to me, stretches her body, and speaks with a smile.」(その女性は私の方を向き、体を伸ばして、笑顔で話します)としました。 あとは実行すると、セリフ音声に合わせて口元の動きが調整されます。
3
033:Wan22 S2Vで読み上げ動画を作る
全体公開
今回はWan2.2のS2Vモデルを使って、セリフ音声と画像から、読み上げ動画を作ってみました。 S2Vは、音声からそれに合った動画を生成するものですが、元画像を指定するとそれをもとにI2Vのように画像に沿った動画を生成してくれます。 前回使った魔法少女画像の顔アップ(2枚目)を元画像に指定し、音声として「魔法少女Muacca、いつもみんなと楽しく、ですです」という読み上げ音声を指定してできたのが1枚目の動画です。 残念ながらちちぷいには音声付の動画は投稿できないので、口パクだけになってしまいますが、元画像のキャラがなにかしゃべっている感じになっているのは分かるかと思います。 Wan2.2 S2Vですが、UIとしては公式から配布されているComfyUIワークフローを用いて実行しました(3枚目)。 基本的にはデフォルト値のままで使うのがいいようです。 ちなみに16fpsが指定されているのですが、これを30fpsとかにすると音声と口パクがズレるので、変えないほうが良いようです。fpsを変更したい場合は、生成した動画を別のツールでフレーム補間すればよいと思います。 あと、公式の情報では生成される動画は77フレーム分と書いてあって、これは変更しないほうが良いとのことでした。16fpsだと4秒くらいの動画になるはずなのですが、結果として生成されたのは14秒くらいのものだったので、それがなぜなのかはよくわかりません。投入した音声は4秒くらいだったので、ここに投稿しているものは後ろの無音声部分をカットしてあります。
4
032:EasyWan22でEndImageを指定する
全体公開
今回はEasyWan22でEndImageを指定して動画生成してみました。 いままでは動画の元画像をStartImage(最初の1枚)だけに指定していましたが、動画の最後の1枚(EndImage)も指定すると、どういう動画にするのかのコントロールがやりやすくなります。 2枚目の普段着のMuaccaさん画像と、3枚目の魔法少女風なMuaccaさんを使って試してみます。 4枚目の画像がEasyWan22のワークフローで、黄色い丸で囲んだノード「UseEndImage」の「Enable EndImage」を「yes」にします。デフォルトでは「no」になっているので、それをクリックして「yes」にかえてください。 そうするとその下にある「EndImage」ノードがアクティブになるので、そこに最後の1枚の画像を指定します。 上記のようにStartImageとEndImageを指定して生成したのが1枚目の動画です。普段着からだんだん魔法少女っぽい衣装に切り替わっていく感じになりましたね! ↓ちなみに以下が動画生成時のプロンプトです。ご参考まで。 ========== An elf girl spins clockwise. As she spins, her clothes change into a cute magical girl outfit, emitting magical effects. Countless pop star patterns around her continue to rotate and rise into the sky. The girl's hair and outfit flutter gently in time with her movements. The color intensity does not change.
他のクリエイターの投稿
15
悪魔的クロスボウガール
580コイン/月以上支援すると見ることができます
9
9枚:OLグラビア
150コイン/月以上支援すると見ることができます
10
あずさ写真集「あずさAZUSA」
100コイン/月以上支援すると見ることができます
29
【かのかり】千鶴:ヤバい客…?
100コイン/月以上支援すると見ることができます
5月リリース新機能情報
全体公開
みなさん、こんにちは!🌟 今回は、5月にリリースした機能改善をご紹介します! ▼生成機能関連 マイプロンプト保存枠の追加に対応 ご要望の多かった、マイプロンプトの保存枠追加購入に対応しました💪 「もっとたくさん保存したい!」という声を受けて実装した機能です。 これまで保存上限に達すると新しいプロンプトを登録するために整理が必要でしたが、保存枠を追加購入することで、より多くのプロンプトを管理できるようになりました。 お気に入りのプロンプトや用途別のプロンプトを、これまで以上に便利に保存してご活用ください! ▼コレクション機能関連 コレクションページの情報を充実 コレクションのサイドバーに、コレクションへ作品を追加しているユーザーを表示するようになりました。 また、コレクション一覧や詳細ページのUIも改善し、作者名やプロフィール画像が表示されるようになっています。 お気に入り作品を探したり、気になるクリエイターを見つけたりしやすくなりました✨ ▼検索機能関連 検索結果ページにモデル別タブを追加 検索結果ページにモデル別タブを追加しました。 新着作品ページと同様に、利用モデルごとに作品を絞り込めるようになり、目的の作品を探しやすくなっています。 上記以外にも、細かな改善や不具合修正を実施しています。 今後もみなさんにとって「使いやすく!」「楽しく!」利用できるサイトを目指して、継続的に改善を進めてまいります。✨
12
リミテッドバトル
580コイン/月以上支援すると見ることができます
13
2026.6.1
100コイン/月以上支援すると見ることができます
4
「高解像度」ジッと見つめているシリーズ「スマホ壁紙」
100コイン/月以上支援すると見ることができます
10
クラゲ・アイスビームランス
580コイン/月以上支援すると見ることができます
7
二人のJK313~319
100コイン/月以上支援すると見ることができます
15
シャチ・アンカーアックス
580コイン/月以上支援すると見ることができます
2
メカガール32
100コイン/月以上支援すると見ることができます
13
アンケートのボツ画像
100コイン/月以上支援すると見ることができます
15
氷の洞窟のコミカルホラー
580コイン/月以上支援すると見ることができます
4
アイドルのビキニといえばこれ!🦪👙
全体公開
Xで募集した衣装より「貝殻ビキニ」! https://x.com/5pmidol/status/2051633013008822335 リクエストいただきありがとうございます! すべてにお応えするのは難しいですが… いつもいいねやコメントいただきとても励みになっております😊 🌟SNSアイコンプレゼント🌟 メンバーシップ会員限定でAbyStarメンバーのアイコンをプレゼント中! chichi-puiのアイコンにぜひ設定してね♡ https://membership.chichi-pui.com/posts/images/77cd6656-5a56-4d92-a565-db6bbe941927/ 🌟BOOTHでイラスト集公開中🌟 新作も公開予定なのでフォローお願いします! https://5pmidol.booth.pm/ 🌟Xでは毎日イラストを投稿中🌟 Xもフォローお願いします! https://x.com/5pmidol
40
謎の海産物フィギュアコレクション73
全体公開
今まで投稿した中からGeminiで生成したフィギュアのみを集めました。 40枚たまったら順次アップしていきます。 ※ファイルの総容量が100MBを越えないように画質を下げて投稿しています