Z-ImageをRTX5090で動かしてみたが生成速度はよさげ

2025年11月29日 · 約3分

個人開発者

Z-Imageがでて数日たちますが一応テストしてみました。

フローはComfyUIの公式からダウンロードしてます。

ステップ数による生成速度と画像の差

解像度はデフォルトだと2048x2048ですがフルHDが私の場合は欲しいの1920x1088にしてます。

相変わらず幅は1088になるんですね。

プロンプトは日本語でシンプルにしてます。

東京タワーが見える公園

ステップ数による生成速度ですが画像を見てもらったら生成時間が一応、書いてます(左上から4step)
生成速度はいいのですがZ-Imageの実写風景がブラーがかかっているというか全体的にそもそもの画像が変じゃないですか？
気のせいなんですかね・・・

4stepの1920x1088で4.1秒です。

8stepの1920x1088で7.6秒です。

20stepの1920x1088で18.7秒です。
差は正直わからないですね。

なんか違和感があったのでテストです。
20ステップです(以降も20ステップとします)

男性が学校で授業の講師をしている

ふむ、まぁ少し画像が汚い感じもしますが普通ですかね。
ここでいい点ですがStableDiffusionとかでこの感じの絵を出すと机が逆になったりします。
ここはさすがですね。

一応,4stepでの画像です。黒板が一体どうなっているのか謎ですがあまり変わらないです。

デフォルトのアニメスタイルでのテストです。

アニメスタイル,男性が学校で授業の講師をしている

まぁQwen-Imageの時と似た感じですね

Z-ImageでのNSFWですがアップロードできないのであれですが出力はできます。
ただ出力は少しやっぱ不安定？
Qwen-Imageとかと同じで普通に出すと大切な部分は布で隠れますが実は以下の文字とか入れると・・・

別世界の男性

これは例で他にもたくさんありますが別世界のとか異世界のとかいれるとなぜか出ますね。
出力は不安定です。

Qwen-Imageよりだいぶ軽量なのでどうなのかと思いましたが普通でした。
4stepも20stepもQwen-Imageと違ってあんまり差を感じない気がします。
Lora作ってみて比較してから今後、使うかは考えたいですね。
生成速度は最高ですね。