2
400コイン/月以上支援すると見ることができます
9
全体公開
今回はFooocusのDescribe機能についてです。 最近はChatGPT、GeminiなどのマルチモーダルなAIモデル(テキストだけでなく、画像や音声等いろいろなフォーマットの入出力に対応したモデル)が登場してきています。 もともとChatGPTなどのLLM系モデルは言語能力が高いので、画像系モデルのSDXL等よりはプロンプト解釈が的確です。なので、狙った服装、狙った構図等、思い通りに画像生成したい場合はマルチモーダルなモデルを使う方が手っ取り早くなってきています。 ただ、マルチモーダルなモデルは今のところクラウド利用しかできないケースが多いので、ローカルでお手軽に出力、というのはもう少し先の話になりそうです。そもそもLLM系モデルは一般的な市販GPUのVRAMには乗り切らないくらいパラメータ数多いですしね…。 そんな時に使えるんじゃないか、というのがこのDescribe機能です。 これは入力した画像からSDXL系のモデルで出力するためのプロンプトを生成してくれるもので、例えばChatGPTで生成した画像に近いものをSDXLから出力させるような使い方ができます。 さっそくやってみましょう。 2枚目の画像がChatGPTに出力してもらった画像です。水墨画で、満月を背景にくノ一がジャンプしている、みたいな指示で出力されました。なかなかいいですね。 さてこれをFooocusでDescribeしてみましょう。3枚目の画像のように、「Imput Image」をチェックして、「Describe」タブを開きます。その画像領域に先ほどの画像をセットして、「Content Type」を「Art/Anime」を選択して「Describe this Image into Prompt」のボタンを押すと、プロンプトが生成されます。プロンプト欄に書かれているのが、Describe結果ですね。 さてこのプロンプトを使って早速出力してみましょう。その結果が4枚目です。 なかなかイイ感じなんじゃないでしょうか。 さて、今度はくノ一姉さんをいつものMuaccaさんに差し替えてみましょう。人物フレーズを差し替えて、モノクロではなくカラーで出力するようにプロンプトを変更した結果が5枚目です。 かっこいいですね。 ちなみに今回、Describeする際に「Apply Styles」をチェックしていたので、styleとして「Fooocus V2」と「Fooocus Masterpiece」が適用されていました。これをいつもの絵柄にするために自分のstyleに変更したのが6枚目です。 この状態で、Fooocusの「Image Prompt」(指定した画像も参考にして出力してくれる機能、7枚目画像のようにして指定)も併用して出力したのが1枚目の画像でした。元画像の雰囲気に少し寄る気がしますね。 ちなみに他のi2iも試してみました。 「Vary(Subtle)」で出力したのが8枚目、「Vary(Strong)」で出力したのが9枚目です。 色々な手段があるのは嬉しいですね。 今回のプロンプトは以下の通りです。ご参考まで。 ========================= 1girl, _, from _, solo, pale pink blonde hair, very short hair, long sidelocks, hair between eyes, red eyes, round glasses, pointy ears, large breast, looking at viewer, gloves, full body, weapon, japanese clothes, sword, mask, moon, sheath, full moon, mouth mask, covered mouth, ninja, weapon on back, short sword, ninja mask, BREAK masterpiece, best quality, high score, great score, ultra-detailed high resolution (anime-style 3dcg:1.0), intricate details light color, whitish color line art, light diffusion, muted color, Matte flat color, watercolor gradiation, hyper-realistic, Sleek design
全体公開
くノ一 4K
全体公開
くノ一
全体公開
くノ一 4K
全体公開
くノ一 4K