Qwen-Imageは安定性が最高かもLoraも作ってみた
Qwen-Imageの安定性がすごいという話を聞いたので試して見ました。
今回、試すにあたり崩壊3rdのセナディアLoraをQwen-Imageように作成してみました。
学習に使用したツールはAI-Toolkitです。(5090なら4090のたぶん2倍程度の速度で学習できます。)
学習完了画面(3-4時間くらいかかりました)
学習に使用した画像はStableDiffusionで作成しました。(学習素材は1080x1920メインです)
Qwen-Imageのフローは公式フローを使っています。(高速化loraを使い忘れてますがきにしないでください。)
使ったプロンプト(女の子が一人,senadia,前に向かってピースしている)
すごいです日本語で入力できます。
さらに背景を追加してみます。
使ったプロンプト(女の子が一人,senadia,前に向かってピースしている,背景は日本の街並み)
服装も変えてみる
使ったプロンプト(女の子が一人,senadia,前に向かってピースしている,背景は日本の街並み,服装はメイド服)
これはさようならStable Diffusionでは・・・
最後に画像サイズを大きくして水彩画にしています。
高速化loraを使わなくても30秒かからなかったです。(1920x1088で少しミスってますが問題なし)
日本語が使えるのはでかすぎます現状、LoraやCheckpointが出たばっかでほぼないですがこれから増えるならいい選択肢です。
Lora作ればこれでよさそう。
Fluxみたいに1枚の画像からLoraつくっても安定するのかも気になります。
最終生成画像だけ貼っておきます。(これはクリックできます)
崩壊3rdのセナディアちゃんですぜひプレイしてみてください。
AIアートのページで崩壊3rdのキャラで色々テストしてましたがキャラが遠くなったりすると安定性が悪かったので代替を探していたのですが安定性がよさそうならヴィタちゃんもLoraつくろうかな