026：Image Promptについて

2025/7/20 19:08

#女の子

今回はFramePackのお話はお休みして、FooocusのImage Promptについてです。

Fooocusのimage to imageの機能の中に、Image Promptというのがあります。これは画像をもとに、出力をコントロールするといったような機能です。ControlNetのFooocusでの実装、みたいなものだと思えばいいのだと思います。
今回は以下のテキストプロンプトをベースに、ImagePromptを試してみたいと思います。
＝＝＝＝＝
1girl, _, from _, blonde hair, medium hair, messy hair, twintails, big hair, black ribbon, blue eyes, tsurime, sanpaku, high neck no sleeve steampunk style leather jacket, Gear ornament, beret, short red skirt, pleated skirt, dancing head tilt, leg up, white background
＝＝＝＝＝

上記のテキストプロンプトで不通に出力した結果が2枚目の画像です。

さて、ではImage Promptを開いてみましょう。（3枚目）
いつものようにテキストプロンプトの入力欄の下の「Input image」をチェックして、出てくるタブのなかから「Image Prompt」を選択します。
そうすると４つのエリアが表示されます（画像ではその中の２つのエリアだけを表示）。
表示エリアの下に選択肢があって、「Image Prompt」、「PyraCanny」、「CPDS」、「FaceSwap」のどれかを指定できるようになっています。
今回は「Image Prompt」と「CPDS」を試してみます。

①CPDS

CPDSはいわゆるCannyと呼ばれている機能と同じようなポーズ適用効果のあるもののようです。FooocusにはPyraCannyというそのままの名前の機能もあるのですが、今回試した感じ、CPDSのほうがいい結果が得られたのでこちらを紹介しておきます。
指定したのは4枚目の画像で、キャラクターがダンスしている感じのポーズです。
これを5枚目のようにして、画像エリアにドラッグ＆ドロップするとセットできます。
この状態で出力した結果が6枚目です。テキストプロンプトだけだと右脚が上がっている感じでしたが、CPDSを使った結果では指定した画像に近いポーズになって、左脚が上がっています。

②Image Prompt

Image Promptは指定した画像の内容を、出力画像に反映する機能です。テキストプロンプトで指定する内容を補強するような感じで機能します。
今回は7枚目の、スチームパンクっぽい衣装のMuaccaさん画像を指定してみました。
元画像は8枚目のように画像エリア内にドラッグ＆ドロップしてください。
この状態で出力した結果が9枚目です。衣装がテキストプロンプトだけだった2枚目よりも、指定した元画像に近くなっているのがわかると思います。

③CPDS + Image Prompt

さて、Image Promptの効果は重ね掛けすることができます。
10枚目のように、今回試したCPDSとImage Promptを両方設定してみましょう。
この状態で出力した結果が1枚目です。衣装の感じと、ダンスのポーズ、どちらもテキストプロンプトだけのときよりも、指定した画像に近い感じになっていると思います。

今回は「Stop At」や「Weight」といったパラメータは調整していないですが、「Stop At」はどこまでImage Promptの効果をかけ続けるか、「Weight」はImage Promptの効果の度合いについてのパラメータです。
「Stop At」を長くするとImage Promptの効果を長くかけ続けてくれますし、「Weight」を重くするとImage Promptの効果を強くしてくれます。複数のImage Promptを重ね掛けする際には、このあたりのパラメータで効き具合を調整するといいのかも知れませんね。

Muacca

38 投稿

フォロー 545

フォロワー 870

画像生成/動画生成についての自分なりのノウハウを不定期連載していました。いまは更新停止しています。すぐ情報古くなるので、有料記事はやめて全公開に変更しています。
お役に立てるかどうかは分からないですが…ご興味があればどうぞ。

AnimagineXL + Fooocusな組み合わせでのノウハウ…だったのですが、最近はFramePack/Wan2.2/ChatGPT/Nano Banana/AnyTestなどなど節操がなくなって来ました。

Muaccaさんの他の投稿

すべてを見る

036：Qwen Image Edit の使い方

全体公開

今回は、元画像からテキスト指示で画像を編集できるQwen Image Editを試してみました。例によって、差分の画像をStart-Endにフレーム指定して動画を作るのに便利、という動機からです。まずは元画像としていつものようにAnim4gineで画像を用意します（2枚目）。これを3枚目の画像のようにしてQwen Image Editのワークフローにセットします。プロンプトとしては、「背景だけをフォトリアルな森の画像に差し替えてください」みたいな自然文をgoogle翻訳で英語にしたものを使ってみました（4枚目）。今度は4枚目の画像を元にして、「キャラクターを削除して背景だけにしてください」とすると、5枚目のような森の風景だけの画像になりました。消しゴムマジックみたいなことができますね。さらに「キャラクターを削除するけど、線画だけは残してくれ」としてみたのが6枚目で、そこから「背景を夜にして、線画を光らせてくれ」としたのが1枚目、といった感じです。 nano bananaほど指示がきれいに反映されるというわけではなく、融通が利かないところもあるんですが、これをローカルのPCで使い放題というのは結構楽しいです。いろいろ試してみたくなりますね。

035：Anytestの使い方

全体公開

Wan2.2で動画を作るときにはポーズ差分の画像があるとStart-Endでフレーム指定で安定した動画が生成できるので、最近はポーズ差分画像をどう作るかをいろいろ試しています。 nano bananaは強力なのですが、制約があったり絵柄がnano banana絵柄に寄ったりするので他の手段も試している、というか。私がメインで使っている画像生成モデルはAnimagine4なので、Controlnetでポーズ指定するという手が使えます。 SDXL系のControlnetとしてはAnytestという強力なブツがあるので、それを試してみました。まずは2枚目のような、大雑把な構図指定画像を手描きします。これはClip Studio Paintでマウスでちょいちょいと5分程度で描いた代物で、「まあなんとなく言いたいことは分かる」レベルのものかな、と思います。この構図指定画像を参照画像として設定しているのが3枚目の画像で、Anytestを使うためのComfyUIワークフローです。このワークフローで画像を生成したのが1枚目です。なんとなくそれっぽくはなっている気がしますね。 ↓プロンプトはこんな感じにしています。 1girl, _, from _, blonde long hair, blue eyes tareme, forehead, pointy ears large breast, groin tendon slim bod, single-shoulder long magical black robe, bra strap, mini skirt under robe frill skirt, contrapposto, water wave background, smile, (glitter magic circle effect:1.2) from hand, blue water effect, pure clear realistic water, splash water around wind blowing さて、Anytestですが、結構いろいろなことができる「万能Controlnet」と言われていて、例えば4枚目の画像の真ん中の部分を黒塗りでつぶして（5枚目）これを参照画像として渡すと、1枚目の画像のポーズを変更することができたりもします（6枚目）。 1枚目の画像と6枚目の画像を動画のStart-Endフレームに指定すれば、なんとなく水魔法を使っているエルフ姉さんの動画ができるような気がしますね！とまあこんな感じに便利なControlnet「Anytest」ですが、月須和さんがHuggingFaceで公開してくれています。ありがたいですね。 https://huggingface.co/2vXpSwA7

034：InfiniteTalkで読み上げ動画を作る

全体公開

前回はWan2.2のS2Vモデルを使って、セリフ音声と画像から、読み上げ動画を作りましたが、今回はセリフ音声と動画から、読み上げ動画を作ってみます。前回のはWan2.2 S2Vで1枚の画像から動画を生成したのですが、口元以外の箇所はあまり動かないというか、ほぼ口パク動画、みたいな感じでした。今回は人物がなにか動いている動画をもとに、口元をセリフに合わせて口パクさせるというもので、動きのある読み上げ動画を作る場合はこちらの方が良いようです。こういった手法はVideo to Video（V2V）と呼ばれているようですね。読み上げのためのV2VにはInfiniteTalkを用いてみました。 InfiniteTalkはまだWan2.2には対応していないので、Wan2.1と組み合わせて使ってみています。 2枚目の画像がInfiniteTalkを使うためのComfyUIのワークフローで、画面下の方で元となる動画（1枚目）を指定しています。セリフ音声は上の方（音声を読み込む、のところ）に指定してみています。 3枚目もワークフローの一部で、真ん中のあたりにプロンプトを指定しています。この手法の場合、キャラクターの見た目も動きも動画で指定しているので、プロンプトは簡単に「The woman turns to me, stretches her body, and speaks with a smile.」（その女性は私の方を向き、体を伸ばして、笑顔で話します）としました。あとは実行すると、セリフ音声に合わせて口元の動きが調整されます。

033：Wan22 S2Vで読み上げ動画を作る

全体公開

今回はWan2.2のS2Vモデルを使って、セリフ音声と画像から、読み上げ動画を作ってみました。 S2Vは、音声からそれに合った動画を生成するものですが、元画像を指定するとそれをもとにI2Vのように画像に沿った動画を生成してくれます。前回使った魔法少女画像の顔アップ（2枚目）を元画像に指定し、音声として「魔法少女Muacca、いつもみんなと楽しく、ですです」という読み上げ音声を指定してできたのが1枚目の動画です。残念ながらちちぷいには音声付の動画は投稿できないので、口パクだけになってしまいますが、元画像のキャラがなにかしゃべっている感じになっているのは分かるかと思います。 Wan2.2 S2Vですが、UIとしては公式から配布されているComfyUIワークフローを用いて実行しました（3枚目）。基本的にはデフォルト値のままで使うのがいいようです。ちなみに16fpsが指定されているのですが、これを30fpsとかにすると音声と口パクがズレるので、変えないほうが良いようです。fpsを変更したい場合は、生成した動画を別のツールでフレーム補間すればよいと思います。あと、公式の情報では生成される動画は77フレーム分と書いてあって、これは変更しないほうが良いとのことでした。16fpsだと4秒くらいの動画になるはずなのですが、結果として生成されたのは14秒くらいのものだったので、それがなぜなのかはよくわかりません。投入した音声は4秒くらいだったので、ここに投稿しているものは後ろの無音声部分をカットしてあります。

すべてを見る

他のクリエイターの投稿

桜彩夢華

500コイン/月以上支援すると見ることができます

蜜華

期間限定アプリコットパイ

100コイン/月以上支援すると見ることができます

rakia20002000

深淵のプリマドンナコーデ

580コイン/月以上支援すると見ることができます

リンファ75

花庭の魔女見習い

580コイン/月以上支援すると見ることができます

リンファ75

狐巫女姉妹

100コイン/月以上支援すると見ることができます

rakia20002000

猫🐈とおだんごちゃん🍡✨169～175

100コイン/月以上支援すると見ることができます

まーるのおだんご工房🍡✨

草原少女113～119

100コイン/月以上支援すると見ることができます

まーるの別荘

湖畔の水精霊

580コイン/月以上支援すると見ることができます

リンファ75

2026.6.23

100コイン/月以上支援すると見ることができます

こたつ

ComfyUIのサブグラフでノードを整理しよう

全体公開

前回↓までで、Detalerを組み込み込んだ（画像１）事で、ノードが増えて煩雑になりました。 https://membership.chichi-pui.com/posts/images/a23135f8-68c4-42e0-93b5-8ca579eba927/ 合わせて、seedとsampler・schedulerを外出しにしたため、接続する線が増えてしまいました。そこで今回は、サブグラフ機能を使ってノードと接続線を整理します。 ※サブグラフ機能とは、複数のノードを纏めてしてしまう機能です。　纏める事で元のフローが簡潔になり、見やすく整理もできます。　また、纏めたノードはコピーペーストが可能で、別のフローに流用し易くなります。１．先にseedとsampler・schedulerの線を簡単に整理します。　　RerouteノードでKSampler、FaceDetailer、Detalerへの接続を芋づる式に繋げておきます（画像２）。２．纏めるノードを選択して、任意のノードを右クリックします。　　表示されたコンテキストメニューから「サブグラフに変換」をクリックします。　　もしくはノード選択後、選択メニュー（ノードを選択した際に上に表示されるメニュー）から、「選択範囲をサブグラフに変換（四隅から矢印が内に向かっている）」アイコンをクリックします。（画像３）。３．選択した複数のノードが一つのノードに纏まります（画像4）。　　※ここのままでも使えなくは無いですが、見栄えが悪いですし接続線が整理できませんので、サブグラフの内容を編集します。４．サブグラフ化されたノードをダブルクリックするか、タイトル右にある編集（四角に斜めの矢印の付いた）アイコンをクリックすると、サブグラフの編集モードになります（画像５）　　※元のフローに戻る時は、キャンパス左上の「グラフ」の左側にある「戻る（曲がった矢印）」アイコンをクリックするか、「Esc」キーを押して下さい（画僧６）。５．入力・出力の端子を編集します（画像７～１１）。　　入力・出力の端子の順番は合わせる様にして下さい（並び順はお好みで）。　　端子を右クリックするとメニューが出ます（画像７）。　　・Disconnect Links・接続を外す　　・Rename Slot：端子の名前変更（ダブルクリックでも可）（画像９）　　・Remove Slot：端子を削除　　　※各端子は、接続していた線のデータ形式が保存されています。　　　　元のデータ形式と異なるデータ線は接続できませんので、一度削除してから繋ぎ直して下さい。　　端子の編集が終わると、画像１２の様になります。　　※入力端子から出力端子へ直接繋ぐ事は出来ません、何らかのノード（Rerouteなど）を経由して下さい。６．次に設定項目（良く変更する可能性のある項目）を選んで、表に表示させる設定をします（画像１３）。　　※Detailerなら、モデル、steps、cfg、denoiseなど　　設定項目を右クリックして表示されるコンテキストメニューから「ウィジットを昇格」をクリックします。　　全て設定し終わったら、編集モードを抜けてフローに戻ります。　　端子名と設定項目が表示されたノードが出来上がります（画像１４）。７．他にサブグラフ化したノードを全て同様に行います（画像１５）。　　必要な接続も全て行って下さい。８．このままでも使えますが、画像生成中のプレビューが表示されないので、表示されるようにします。　　そのためには一度生成を行い、ノード上にプレビューが表示されている状態にします（画像１６）。　　※サブグラフ機能が搭載された当初は、何もしなくても表示されていましたが、アップデートで表示されなくなりました💦 ９．サブグラフの編集状態にします。　　ノードのプレビューを右クリックして表示されるコンテキストメニューから「ウィジットを昇格」をクリックします（画像１７）。１０．全てのサブグラフで設定が終われば、サブグラフ化と線の整理は完了です（画像１８）。　　　ノードの位置やサイズを調整して使いやすくしましょう。入力・出力の端子の順番を合わせた事で接続線が綺麗に揃っています。サブグラフのノードは普通のノード同様、コピーペーストで増やす事が出来ます。増やしたDetailerは検出モデルを変更する事で、違う部位のDetailerになります。接続線も揃った状態なので、簡単に増設可能です（画像１９）。サブグラフは便利な機能ですので、色々触って研究してみてください。 -------------------------------------------------------------------------------------------------------- おまけ１設定項目の表示順番を変更したい場合。 ※ウィジット項目は昇格を行った順に表示されますが、後から順番を変更する事もできます。・サブグラフのノードを右クリックして表示されるコンテキストメニューから「サブグラフウィジットを編集」をクリックします（画像２０）。・キャンパスの左側にウィジットの一覧が表示されます（画像２１）。・順番を変更したい項目の左端の（点が６個並んだ）アイコンをドラッグして上下に移動できます。　目的の位置でマウスのボタンを離して下さい。　※この画面を開くと、サブグラフのノードのサイズが小さくなりますｗ -------------------------------------------------------------------------------------------------------- おまけ２右クリックしても「ウィジットの昇格」が表示されない項目欄を表示したい場合。２通りあります。１．入力欄をサブグラフの入力端子と繋ぎます。　　※入力端子と接続した入力欄は表示されるようになります。　　　なお、前のノードからの入力は必要だが表示させたくない場合は、Rerouteノード経由で接続します。　　　上の作業でseed、sampler、schedulerの入力欄が表示されないのはこの為。２．「サブグラフウィジットを編集」画面から、目的の項目左端の「表示（目に斜め線が入った）」アイコンをクリックして表示状態にします。　　入力端子が無い又は、入力させたくない場合などに使います。　　※表示されていない項目は「非表示／ネストされたパラメータ」にあります。　　　表示状態にした項目は「ノード上で表示」に移動されます。 -------------------------------------------------------------------------------------------------------- おまけ３設定項目の表示名を変更したい場合。複数のノードを使うと設定項目名が同じ場合が出てきます。両方表示させる場合、同じ名前では区別が付きません。その場合は、設定項目を右クリックして表示されるコンテキストメニューから「ウィジット名を変更」で変更可能です（画像１２）。

２２（にゃんにゃん）

ECHIDNAリアル感強め女子プロレスラー

100コイン/月以上支援すると見ることができます

ガレージガーデン

路地裏で見つけた野良猫

100コイン/月以上支援すると見ることができます

P.S.T.A.

砕けた剣をもつ悪魔の少女

580コイン/月以上支援すると見ることができます

リンファ75

「高解像度」ジッと見つめているシリーズ「スマホ壁紙」

100コイン/月以上支援すると見ることができます

nakachi

絵柄指定プロンプト【第一弾】

100コイン/月以上支援すると見ることができます

尾藤みそぎ

ComfyUIではBREAKが効かない？

全体公開

最近知ったのですが、ComfyUIではプロンプトのBREAKが効かないらしいです。そこで、画像４のワークフローを使い、モデル・プロンプト・シード（画像５）とサンプラー・スケジューラー・ステップ・cfg を揃えて、上：基本のClipエンコーダー…① 　　フローは画像６中：BREAK対応のClipエンコーダー…② 　　フローは画像７下：BREAK毎に分割してそれぞれを基本のClipエンコーダーを通して、条件付けを結合…③ 　　フローは画像８の３種類で試しました。結果は ①：画像１ ②：画像２ ③：画像３です。違いが分かりますか？同じ条件なら同じ絵になるはずですが、画像１だけポーズが違います。やはり何らかのプロンプトの解釈違いがある様ですねｗ ※画質面では余り違いを感じられないのは、審美眼が無いからでしょうね💦 対応として簡単なのは、BREAK対応のClipエンコーダーを使用する方法でしょう。 BREAKで分割するのは、分割する分のClipエンコーダーを用意しないといけないので、大変ですｗ ※プロンプトが空の状態でもエラーには成らないので、Clipエンコーダーを多めに用意して置くという手もあります。 ------------------------------------------------------------------------------------------------------------ おまけ画像保存に使ったノードは、Save Image (LoraManager) で、プロンプトをメタデーターとして、ちちぷいで認識できる形式で保存できるものです。しかし、BREAK対応したフローではプロンプト情報を残せませんでした。どうしても残したい場合は別の方法を探す必要があります。 ------------------------------------------------------------------------------------------------------------ 今回使用したカスタムノード BREAK対応のClipエンコーダー・ComfyUI-ppm URL： https://github.com/pamparamm/ComfyUI-ppm 　CLIP Text Encode (BREAK) プロンプト分割・CTR-nodes URL： https://github.com/PGCRT/CRT-Nodes 　String Splitter (CRT) 条件付け結合・ComfyUI Impact Pack URL： https://github.com/ltdrdata/ComfyUI-Impact-Pack 　Concat Conditionings シード生成・RES4LYF URL： https://github.com/ClownsharkBatwing/RES4LYF 　SeedGenerator 画像保存・ComfyUI-Lora-Manager URL： https://github.com/willmiao/ComfyUI-Lora-Manager Save Image (LoraManager)

２２（にゃんにゃん）