メインコンテンツまでスキップ

Z-ImageをRTX5090で動かしてみたが生成速度はよさげ

· 約3分
もみじーな
個人開発者

Z-Imageがでて数日たちますが一応テストしてみました。

フローはComfyUIの公式からダウンロードしてます。

ステップ数による生成速度と画像の差

解像度はデフォルトだと2048x2048ですがフルHDが私の場合は欲しいの1920x1088にしてます。

相変わらず幅は1088になるんですね。

プロンプトは日本語でシンプルにしてます。

東京タワーが見える公園

ステップ数による生成速度ですが画像を見てもらったら生成時間が一応、書いてます(左上から4step)
生成速度はいいのですがZ-Imageの実写風景がブラーがかかっているというか全体的にそもそもの画像が変じゃないですか?
気のせいなんですかね・・・

4stepでの画像と生成速度

4stepの1920x1088で4.1秒です。

8stepでの画像と生成速度

8stepの1920x1088で7.6秒です。

20stepでの画像と生成速度

20stepの1920x1088で18.7秒です。
差は正直わからないですね。

実写人物の生成テスト

なんか違和感があったのでテストです。
20ステップです(以降も20ステップとします)

男性が学校で授業の講師をしている

ふむ、まぁ少し画像が汚い感じもしますが普通ですかね。
ここでいい点ですがStableDiffusionとかでこの感じの絵を出すと机が逆になったりします。
ここはさすがですね。

一応,4stepでの画像です。 黒板が一体どうなっているのか謎ですがあまり変わらないです。

アニメスタイルの生成テスト(Loraなし)

デフォルトのアニメスタイルでのテストです。

アニメスタイル,男性が学校で授業の講師をしている

まぁQwen-Imageの時と似た感じですね

NSFWはできるのか

Z-ImageでのNSFWですがアップロードできないのであれですが出力はできます。
ただ出力は少しやっぱ不安定?
Qwen-Imageとかと同じで普通に出すと大切な部分は布で隠れますが実は以下の文字とか入れると・・・

別世界の男性

これは例で他にもたくさんありますが別世界のとか異世界のとかいれるとなぜか出ますね。
出力は不安定です。

Z-Imageの感想と結論

Qwen-Imageよりだいぶ軽量なのでどうなのかと思いましたが普通でした。
4stepも20stepもQwen-Imageと違ってあんまり差を感じない気がします。
Lora作ってみて比較してから今後、使うかは考えたいですね。
生成速度は最高ですね。