メインコンテンツまでスキップ

Z-Image-TurboのLora作ったからQwen-Imageと比較するぞ

· 約4分
もみじーな
個人開発者

Z-Image-TurboのLoraを作りましたのでQwen-Imageと比較したいと思います。

今回は1920x1088の20ステップでのそれぞれの比較とします。

プロンプトはGemini 3.0 Pro生成です。

Z-Image-TurboのLoraの作成方法

一応、書いておきます。

今回,Lora作成にはQwen-Imageと同じくai-toolkitを使用しています。

https://github.com/ostris/ai-toolkit

RTX50シリーズだと以下で動きます。
RTX5090で今回もZ-Image専用で再インストールしているので問題ないです。

git clone https://github.com/ostris/ai-toolkit.git
cd ai-toolkit
python -m venv venv
.\venv\Scripts\activate
pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu128
pip install -r requirements.txt

トリガーワードとかは特に今回はなしです。

一応、全体的な設定はこんな感じです(クリック拡大できるようにしときます)

Lora作成時間は1時間ちょうどくらいでしたね。

比較するぞ

プロンプト1

プロンプト1は以下です。

見渡す限りのひまわり畑の中に佇む美少女。風になびく長い髪、背景には夏の巨大な入道雲と透き通るような青空。繊細な光の表現と鮮やかな色彩。キラキラとした瞳、ドラマチックな構図、幻想的な夏の思い出。

Qwen-Image

Z-Image

プロンプト2

プロンプト2は以下です。

幻想的な水族館。巨大なアクリルパネルの大水槽の前に佇む美少女。深い青とエメラルドグリーンの光が彼女を照らし、水槽の中ではジンベエザメやマンタ、色鮮やかな魚の群れが渦を巻いて泳いでいる。水面から差し込む光の柱(チンダル現象)と、キラキラと輝く無数の泡。少女は感動して水槽を見上げている。繊細で透明感のある背景美術、ドラマチックな構図、鮮烈な色彩。圧倒的な没入感。見渡す限りのひまわり畑の中に佇む美少女。風になびく長い髪、背景には夏の巨大な入道雲と透き通るような青空。繊細な光の表現と鮮やかな色彩。キラキラとした瞳、ドラマチックな構図、幻想的な夏の思い出。

Qwen-Image

Z-Image

プロンプト3

プロンプト3は以下です。

神聖で幻想的な夜の神社。無限に続く赤い鳥居のトンネル。宙に浮く無数の狐火(きつねび)や灯籠の温かいオレンジ色の光。豪華な着物を着た銀髪の美少女が、振り返っている。周囲には蛍が舞い、森の木々が静かに見守っている。神秘的で静寂な雰囲気、魔法のような光の演出、高精細な描写。

Qwen-Image

Z-Image

プロンプト4

プロンプト4は以下です。

春、緑に覆われた古い廃線跡(鉄道のレール)。トンネルの出口付近で、満開の桜がアーチのように咲き誇っている。制服を着た少女が枕木の上をバランスを取りながら歩いている。舞い散る花びら、木漏れ日、錆びた鉄と新緑のコントラスト。ノスタルジックで爽やかな空気感。

Qwen-Image

Z-Image

結論

Lora使えばあんまりかわらなそう?
一応、最後に生成に使った画面をそれぞれ張っておきますが速度が圧倒的にZ-Imageは速いです50秒と18秒で同じそうならZ-Image一択ですかね。
4stepにすれば速度はさらに早いです。
この流れだとZ-Image-Turbo-Editもくるのかな?

Z-ImageをRTX5090で動かしてみたが生成速度はよさげ

· 約3分
もみじーな
個人開発者

Z-Imageがでて数日たちますが一応テストしてみました。

フローはComfyUIの公式からダウンロードしてます。

ステップ数による生成速度と画像の差

解像度はデフォルトだと2048x2048ですがフルHDが私の場合は欲しいの1920x1088にしてます。

相変わらず幅は1088になるんですね。

プロンプトは日本語でシンプルにしてます。

東京タワーが見える公園

ステップ数による生成速度ですが画像を見てもらったら生成時間が一応、書いてます(左上から4step)
生成速度はいいのですがZ-Imageの実写風景がブラーがかかっているというか全体的にそもそもの画像が変じゃないですか?
気のせいなんですかね・・・

4stepでの画像と生成速度

4stepの1920x1088で4.1秒です。

8stepでの画像と生成速度

8stepの1920x1088で7.6秒です。

20stepでの画像と生成速度

20stepの1920x1088で18.7秒です。
差は正直わからないですね。

実写人物の生成テスト

なんか違和感があったのでテストです。
20ステップです(以降も20ステップとします)

男性が学校で授業の講師をしている

ふむ、まぁ少し画像が汚い感じもしますが普通ですかね。
ここでいい点ですがStableDiffusionとかでこの感じの絵を出すと机が逆になったりします。
ここはさすがですね。

一応,4stepでの画像です。 黒板が一体どうなっているのか謎ですがあまり変わらないです。

アニメスタイルの生成テスト(Loraなし)

デフォルトのアニメスタイルでのテストです。

アニメスタイル,男性が学校で授業の講師をしている

まぁQwen-Imageの時と似た感じですね

NSFWはできるのか

Z-ImageでのNSFWですがアップロードできないのであれですが出力はできます。
ただ出力は少しやっぱ不安定?
Qwen-Imageとかと同じで普通に出すと大切な部分は布で隠れますが実は以下の文字とか入れると・・・

別世界の男性

これは例で他にもたくさんありますが別世界のとか異世界のとかいれるとなぜか出ますね。
出力は不安定です。

Z-Imageの感想と結論

Qwen-Imageよりだいぶ軽量なのでどうなのかと思いましたが普通でした。
4stepも20stepもQwen-Imageと違ってあんまり差を感じない気がします。
Lora作ってみて比較してから今後、使うかは考えたいですね。
生成速度は最高ですね。

Nano Banana Proで2Dゲームのスプライトシートを作るプロンプト

· 約3分
もみじーな
個人開発者

昨日、何となくクソゲー作りました。

何も考えずにスプライトシートを作った時に動作が初回生成では少しバラバラなのと切り取りがめんどくさかったのでプロンプトを適当につくりました。

少し安定性がますのでメモも兼ねてますこれは。

試しにAntigravityのほうも画像生成しましたがすぐに制限で使えなくなるのとスプライトシート作らせてもどうせ初期だとアニメーションにならないですね。

プロンプトでスプライトシートも固定しとけばいけるかも?

出したいキャラとかあるなら画像貼り付けて画像のキャラでとかに変更してください。

動作も適当に変更してください。

Nano Banana Pro用のプロンプトは以下

金髪で黒い翼の少女の横スクロールアクションのスプライトシートの画像を作成。
アニメスタイル、背景は白
スプライトシートの構成図。
2048x2048ピクセルのキャンバス。
1行目:左に向かって走る。
2行目:ジャンプする。予備動作から着地まで。
3行目:魔法攻撃を行う連続動作。手を前に突き出す。
4行目:立ち止まって呼吸している待機モーション。
4x4のグリッドで区切られた16個のセル。

生成画像例

まぁ線はでたりでなかったりしますね。(一応,別のチャットページでも作成)

まぁ消してくださいと言えば消えますし足とか手とか細かい調整も可能です。

もしかしたアルファチャネルにする方法もあるかもしれないのであるなら変えてみてください。

1度指定しましたができなかったです。

白なら背景除去とかですぐ消せます

一応、1行目、2行目とか分けてる理由は安定性を上げる為です。

なぜか指定しないとよくわからない動作入ったりします。

続きつくるときは何枚目の画像とかアップロードした画像の続きでとかプロンプト作ればキャラはまったく同じです。

一応、例

最後の画像の続きでダウン時,ダメージ,ドアを開ける、回復エフェクトのスプライトシートをつくって

画像の切り出しはスプライトカッターとか調べればでますしUnityとかについてます。

なんなら解像度もマスも固定なのでAI Studioでカットするアプリも作れるはずです。

いい時代になったものですよね。

Lineスタンプとか一括生成できそうですよねこれ。

AntigravityとNano Banana Proでクソゲーつくったぞ(ゲームあり)

· 約1分
もみじーな
個人開発者

前のやつに追記してますがまだAntigravityが自分に合わなかったので暫くの別れにクソゲーを作らせました。

その名もアルパカダッシュです。

ゲーム作る指示出すときも基本的にフォルダ分けて必要な画像とかBGMとかぶち込んどくだけです。

画像はNano Banana Proでスプライトシートをつくらせました。

線は最初から入ってました

作成所要時間20分ほど画像生成時間含む,無理やりアルパカのスプライトシートを切り抜いたら汚くなりました。

まぁ普通に動くクソゲーです。

以下でプレイできます。

適当にフリーBGMだけ拾ってきてつけてます。

音量注意です。

キーはスペースだけさらに当たり判定もいかれてます。

https://momijiina.com/other/alpaca/

好きなキャラクターの画像からもスプライトシート作ってもらえたのでたぶん2dの同人ゲームも普通に作れます。

Antigravityは定期的に使ってみますがVSCodeに戻ります。

LM Studio用の低消費電力PCをArc Pro B60 24GBで組みたい2(GPUは買ったぞ)

· 約2分
もみじーな
個人開発者

タイトル通りArc Pro B60 24GBを1枚だけ購入しました。

本当は嫌ですが予約購入です・・・・

果たしていつ入荷されるのか

本当は2枚欲しいのですがちょっと構成を考え直す可能性を考慮してとりあえず1枚予約購入です。

ケースも買いなおすことにしました。

結局、あのケースは2スロット厚でギリギリ収まったとしてもおそらく廃熱で死にます。

ごめよHyte お前は倉庫で眠っててくれ

現在、考えているPC構成は以下の2パターンに絞りました。

電源はもしかしたら850か1000wにするかもしれないので合計は目安ですね。

まだ、電力スパイクとかもちゃんと考えてないので・・・

足りはしてるはず。

Aプラン

カテゴリー製品名価格
ケースQUBE 500 Flatpack14,000
マザーボードZ890 AERO G52,830
CPUCore Ultra 5 22528,000
メモリCMK32GX5M2B5600C4034,000
電源RM750e 202512,000
M.2CT500P310SSD8-JP7,000
GPUArc B60 24GB x2240,000

合計387,830円

Bプラン

カテゴリー製品名価格
ケースQUBE 500 Flatpack14,000
マザーボードProArt B650-CREATOR34,000
CPUryzen5 760028,000
メモリCMK32GX5M2B5600C4034,000
電源RM750e 202512,000
M.2CT500P310SSD8-JP7,000
GPUArc B60 24GB x2240,000

合計 369,000円

x8/x8対応のマザーがなさすぎてマザーボードは高くなりがちですね。

一応、Arc Pro B60 24GBをDualで運用を検討している方がいたら安いマザーボードは基本的にNGだと思っておいてください。

性能が落ちます。

また、CPUにも実は制限があります。Ryzenでの例ですが例えばGが付くモデルとかは避けるべきです。

理由はCPU自体が持っているレーン数が少ないため、2枚挿し時に制限がかかる可能性があります。(間違えている可能性はありますがリスクは捨てるべきです)

とりあえず6950xtを前のPCからもぎ取って動作テストはしたいかな。

あまりにもB60がゴミならやめて別を考えます・・・

Google AI Studioで自動4コマアプリをつくったら案外・・・

· 約2分
もみじーな
個人開発者

画像が自動圧縮されるのでwebpに一部、変換しました


タイトル通りです。

AI Studioもだいぶ良くなってますね。

正直これは感動ものです。

作成につかったプロンプトは以下だけ(こんな雑でもいけるのか)

与えられた画像の人物から漫画を生成できるようにしてお題も入力できるようにして
画像をアップロードしなくても、こういうキャラでこういう構成みたいな感じでみたいなプロンプトで作れるようにして

画面はこんな感じのできました

テスト入力 できた漫画 できた漫画2

一応、ダウンロード機能とアスペクト比がおかしかったので修正させてます。

ダウンロードした漫画です。

アスペクト比の修正前です アスペクト比修正後

人物画像からの方も問題はなかったです。

正直、バスより早く走ってたり意味が分からないですが・・・

AI 4コマでそのうちストアとか埋め尽くされそう・・・

そもそもAI Studioの画像生成って何回できるんですかね

かなりの量を生成させましたが特に制限もなさそうでした。

有料アカウントだからなのかはわからないですが結構生成できそう。

Antigravityのエージェントモードは現状はVSCodeより良いかも

· 約3分
もみじーな
個人開発者

一番下に追記してます。
私はVSCodeに返り咲きました。はい。


今年に入ってVSCodeのエージェントを使った開発を恐らく累計で数百時間やってきたきがします。

VSCodeのエージェントに開発ガイドを作成して読ませたりすると通常のAIでは作成できないものも作れるので気に入ってました。

おそらくVSCodeがオープンソースになったこともありAntigravityが登場したのでしょうがGemini3も一緒に出て使えることですごいことになってました。

なにがすごいのかですかAIのコード生成もそうですがAntigravityでは開発ガイドを分割して読むのではなく一括で読んでくれてるのかとても速く高品質です。

VSCodeでエージェントにガイドを読ませると分割して読んでるのでどうしても質の低下もありました。

間違いなく最近使ってたCopilot + Claude 4.5よりも正確にプログラムを作成してくれるので課金プランが出たら間違いなく入ります。

Googleの有料プランにそのままついてきたら本当にクラウドのAIはGoogleが最強になりそうです・・・

一応,VSCodeとAntigravityのどちらもGemini3で同じプラグインを生成させるテストをしました。

左がAntigravity,右がVSCodeです(どっちもGemini3なのでどちらも似た感じです)

プロンプトはどちらも以下だけ

開発ガイドを読んでダッシュボードアプリとしてアナログ時計を開発してください
開発ガイドは最後まで読んで

これだけですがAntigravityは何度やっても1回で成功させます。

VSCodeは同じGemini3なのになぜか一度エラー処理をさせる必要がありました。

現状,Antigravityが上をいっています。

Github Copilotの課金プランどうしようかな・・・


20251126の追記です。

結局,3日くらい使いましたがVSCodeに戻しました。

自律型エージェントとしては確かにVSCodeを超えてます。

問題は私の使い方があってないのかもしれないですがAntigravityに少し複雑なアプリ作らせてたのですが最初はいいのです。

ですが追加だったりエラーだったり処理をさせればさせるほどゴミになっていきます。

結局は人力になってしまう。

あとAntigravityではガイドも一括で読んでくれてると思ったけどそうでもなさそう。

無料で使えるClaudeにすると今度はVSCodeでは処理できるエラーに対処できない。

所詮はまだテスト中のものにすぎないかもですね。

ごめんよVSCode君、Antigravityの方がいいなんていって

Antigravityはお家にお帰り、つばをぺっぺっ

まぁ、無料で使えるのでアップデート待ち

ガイドが必要ない簡単なアプリは特に問題ないです。

LM Studio用の低消費電力PCをArc Pro B60 24GBで組みたい

· 約6分
もみじーな
個人開発者

一応,書いときます(特殊な理由がないならAPI使いましょう)


現在、RTX5090をAI生成もといゲームように使ってますが24時間365日起動しとくのは微妙なのとどうしてもゲーム中に使えないので構成を検討中です。

とりあえずArc Pro B60を年内に1枚買ってみる予定です。(在庫があれば)

私が今回,推論用PCの購入に検討したもの

AMD Ryzen AI Max+ 395

AMD Ryzen AI Max+ 395を買えばいいという話ですがこれは論外です。

中華のミニPCをAIサーバー用途に30万,40万払うのはさすがに怖すぎます。

gmktecのミニPCを過去にサーバーようにフル稼働させたときに1か月もたなったことがあるのでさすがにね・・・
(確かに交換してくれますがデータが吹き飛ぶ可能性があります。)

重要なのは中華ミニPCはサーバーではありません。(通常用途で使ってあげてください)

Corsair AI Workstation 300の日本発売を待ってましたが出る気配もないのであきらめです。
(そりゃ輸入してもいいですよ?ついてるWifiとかの技適がね)

NVIDIA DGX Spark

NVIDIA DGX Sparkも検討しましたが発表時と話が違うぞ?
そのメモリ帯域速度で60万はなんかなと・・・

企業とか開発者じゃなく、個人でこれを買うならケチらずいっそメモリは少し減りますがNVIDIA RTX PRO 6000でも買ってください。

NVIDIA RTX PRO 6000

5090より確かにメモリ量が3倍です。
ただそれだけです。
私がやりたいローカルAIでの動画生成がまだ5秒や10秒でしかも音声なしの状態でこれを買うメリットは存在しません。

まだ、次の世代と生成AIの進化を待つべきです。

絶対、2027年のRubin買った方がいいですよ。

私はSora2(OpenAIのPro)に課金をおすすめします。

Nvidia DGX Station GB300かH200

Nvidia DGX Station GB300は高い高すぎる。
正直、将来的には検討の対象ですが価格以外に騒音と熱を処理できるスペースが現在、ありません。

車が買えるレベルのH200を買うにしても私がやりたいことリストをローカルAIがまだできないので暫くはAPIでいいかなというのが現状です。

買うならDELLとかのAIサーバーになりそう。

それまでに規制の少ない課金AIがでればそれで解決ですがSora2とか見てるとキャラクターとかストーリーとか制限が入りそう。

2026年発売予定のMac Studio M5 Ultra

これは来年あたり買ってみる候補になります。
おそらくメモリ帯域が1TBくらいになります。
メモリ量も1tbにならんかな

そしてArc Pro B60 24GB

今、ソフマップとかで約12万で販売が開始されてます。
安いです。
現在、売れ残りの7900xtxと確かに価格は変わらないですしメモリ帯域速度も遅いです。

しかし重要なのは消費電力とIntelということです。

IntelのGPUを買ったことがないのです。

買ってみます。

ただそれだけです。

10月に7900xtxが投げ売りされてたのですが開けてないのでがこれは飾っておきます。
私には6950xtを積んだ化石PCがまだあるのです。

検討中の構成と大失敗

現在、検討中の構成は以下です。

項目製品名
CPUUltra 5 225
Memory適当に64GBか32GB
MBATXを適当に
PSU750WでGold電源
M.2 SSD1TB
CPUファン一応、簡易水冷買うか?
PCケースHyte Y40
GPUARC B60

どこを失敗しているか

失敗したのはPCケースです。
実は何も考えずに10月にセールしていたのでB60用にY40 Songque Limited Editionを買ってしまいました。
このPCケース何が問題かわかる人にはわかります。

まず価格・・・ではないですね。

そうです、このケースはデザインを追求したPCケースである為にあることができません。

それがデュアルGPUです。

マザボにささらないのです1枚目すらライザーケーブル必須なのです・・・・・

ロープロはささりますね。

しかもこのPCケースを買った理由が既に2つフルプライスで去年買ってあったのですが1万円引きで公式で売ってたのと積みすぎてケースが取り出せないないというアホな理由です。

なんだよPCケース積みすぎって

転売ヤーではないですがそのうちPCたくさんHyteで組んで飾りたいと思い実はHYTE Y70 Silver Wolf Limited Editionもあと3台分あります。

見てくださいとてもきれいです(LEDは一部うざいので消しました)

ホタルエディションも1台ですが予約済ですよ?

仕方がないのでとりあえず1枚構成で組んでみる予定です。

Hyteさんには申し訳ないですが最悪、切断・・・はしないですがケースを変えるか考えます。

多分,箱にいれたまま積んである色んなPCケースだけでRTX PRO 6000が買えますね・・・・

床も抜けそう

Sora2用の動画管理Wordpressテーマを作りたい

· 約1分
もみじーな
個人開発者

Sora2いいですよね。

しかも来月、アダルト解禁らしいですよ?

これは作成した動画を自己管理したいと思い立ち今に至ります。

なのでSynologyで動かせるようにWordpressでSora2ようにテーマを作成中です。

テーマとプラグインで管理してます。

とりあえず動画と説明とプロンプトとかタグ付けとかできるようにしてますが12月が楽しみです。

一応、作成中のテストテーマですダウンしたりしてるかもしれないので見れなかったらあきらめてください

WordpressでSora2プロンプト管理

Sora2のほうはゴミ動画生成してて恥ずかしいので検索しないでね。

テーマぶれぶれでやばい状態です。

Exmentにお知らせ用の既読管理システム(回覧版?)プラグインを作る

· 約1分
もみじーな
個人開発者

閲覧したかどうかがグループウェアの定番としてありますがExmentにはないようなのでサンプルプラグインをAIで作成してみました。

私、個人では必要ないしデバッグもある程度しかできないのでデータ数が増えるとバグる可能性もありますがちゃんと動きはしました。

安否確認とかも定番なので試しに作らせるかもしれないですがデバッグが不完全な安否確認システムって怖すぎですよね。

まぁ、試しにだけそのうち作ります。

開発の方とGithubに入れておくので既読管理システム(回覧版?)は自己責任で使用してください。

なんならちゃんとしたのに誰か作り変えて公開してください・・・