メインコンテンツまでスキップ

「AI」タグの記事が43件件あります

AI tag description

全てのタグを見る

Qwen-Image-2512をArc Pro B60で試したら遅かった

· 約2分
もみじーな
個人開発者

HyperNova 60Bというモデルのテストするついでに試してますがタイトル通りです。

遅いです。

生成はできますがさすがに5090をこれは使います・・・

そもそもIntel GPUのComfyUIの入れ方を調べるのめんどくさかったのでAI Playgroundについてるじゃんと思ってそれを使っているのこれで遅くなっている可能性はありますがね・・・

生成テスト結果

設定は私の好きな20stepの解像度は1920x1088です。
Loraは現在、テストで作成中のものをつかっています。
1生成が445秒はさすがに遅いです。

2枚目の生成なら変わるかと思い連続でやりましたがあんまりかわらず。
確かに427秒と短くなってますが誤差ですよねこれもう

一応,Lgihtningを使って4stepと8stepでテストしましたが画質が微妙です。
4stepが205秒、8stepが265秒って感じですね。
やっぱり20stepはほしい。
Lgihtningも確かに4,8stepである程度きれいになるんですけど画質はかなり落ちてます。
つけたとしても20stepにします・・・

20stepで生成した画像だけ1枚貼っておきます。

Intel ArcだとやっぱりQwen-Imageレベルは遅いですね。

ただ動かせるのでfp8版が動かしたいだけの方にはIntel Arc Pro B60は選択肢に入るのかもしれないですね。

一応,最後に生成中のメモリ使用率です。
1枚目のIntel Arc Pro B60で生成してます。

Z-Image-TurboをArc Pro B60で試してみただけ(案外早い?)

· 約2分
もみじーな
個人開発者

去年,Arc Pro B60 24GBを2枚買ってRTX5090とは別で運用してますが案外気に入っています。

Windowsで運用するならとても静かですね。

Ubuntuだとファンコントローラーが死ぬので少し音が気になります。

と話がずれてましたがArc Pro B60 24GBでZ-Image-Turboをテストだけしました。

問題なく動いたので今後のIntel製品には本当に期待してます。

Arc Pro B60でComfyUIのZ-Imageを動かす

ComfyUIですがIntelのGPUでインストールする方法はとても簡単でした。

IntelからでてるAI Playgroundというソフトをインストールするだけで簡単にインストールできました。

ComfyUIの開き方は画像のよう設定からOpen ComfyUI押すだけです。

Pythonすらインストールしてないけど

どうやって動いているのかは不明です。

インストール後にCMDでPython確認しても反応はなかったので仮想的に動いているんですかね?

モデルファイルの配置方法は基本的に他と同じですがAI Playgroundのインストール先をファイルの場所を開くで開いてそこに入れたらいけました。

Z-Image-TurboをArc Pro B60でテストする

今回は2枚目のArc Pro B60を使ってテスト生成してみましたが問題なさそうです。

1920x1088の20Stepで60秒って感じです。
案外早いですよねこれ?

一応、生成した画像を何枚か貼っておきますがLoraが強すぎて手が微妙になってます。
Z-Imageだと私のLoraは強度1だとなぜか不安定なんですよね。(0.8-0.9で安定)

Qwen-Image 2512も暇だったら試します。

Qwen-Image-2512のLoraができたからQwen-Imageと簡単な比較してみただけ

· 約7分
もみじーな
個人開発者

Qwen-Image-2512が出ましたね・・・・

Loraがそのまま使えると思ったのですがね・・・

ダメでしたので作り直しました。

前のやつの修正版なのもあり何かが変わったわけではないので簡単な比較です。
(人などがリアルになったり細かい描写の修正らしいですがLoraメインの私には人がリアルになってもあまり・・・)

あとは結局,Z-ImageもQwenもそうですがNSFWが微妙なんですよね。

それもあって結局、みんなStable Diffusionですよね。

そろそろ規制解除版でたのかな?

一応、結論を書いておきますがLora適用時の安定性が少し増していました。

もしかしたらai-toolkitのLora作成用データが良くなっただけの可能性もありますが後でヴィタちゃんLoraを作成して考えます。

Qwen-Image-2512のLoraの作成方法

一応、書いておきます。

今回,Lora作成にはQwen-Image,Z-Imageと同じくai-toolkitを使用しています。

https://github.com/ostris/ai-toolkit

RTX50シリーズだと以下で動きます。
RTX5090で今回もQwen-Image-2512専用で再インストールしているので問題ないですがもしかしたらそろそろtorchが新しくでてるかもしれなです。
面倒くさいので確認してないので安定性を求める方は最新版がでてないか確認してみてください。

git clone https://github.com/ostris/ai-toolkit.git
cd ai-toolkit
python -m venv venv
.\venv\Scripts\activate
pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu128
pip install -r requirements.txt

起動

cd ui
npm run build_and_start

一回,buildした後は以下のほうが起動が早いです。

cd ui
npm run start

簡単なai-toolkit設定画面の説明

New Jobでだいたい以下の設定にしてもらえれば動きます(ai-toolkit公式からのおすすめです。)
3bit with ARAが24GB推奨です。
4bit with ARA が32GB推奨です。
私は5090なので4bitでいいはずですが余裕を持たせるために一応3bitにしてみてます。
名前やステップ数も自由に変更してください。
私は3000stepにしてますが1500stepの方が人気な気もします。
ここでは見えないですがさらに下にサンプルプロンプトの設定がありますがお好みです。
精度があがりますが面倒くさいので私はだいたいそのままにしてますね

あとはCreate Jobして開始するだけです・・・
開始した後のインストールが長いです。
新しいやつが出るたびに再インストールしているせいでSSDがどんどん埋まっていくので対策を考え中です。

前のLoraを使ってみた

プロンプトは以下です(適当)

カフェで女性がコーヒーを飲んでいる

見てください前のLoraは完全に死にました。

新しいLoraをテストする

プロンプト1

プロンプトは前のLoraと同じです。

カフェで女性がコーヒーを飲んでいる

いい感じですね。
やっぱりQwen-Imageってプロンプトが同じだと似た構図になりますよね?
Stable Diffusionはランダム要素があって好きだったんですけどね・・

プロンプト2

動物園でパンダがこちらを見ている

まぁ、パンダって感じです。
そもそも学習データに動物を含ませてないのでちゃんと出ているのかは不明

前作のQwen-Imageと簡単に比較してみる

Z-Imageの時に使ったプロンプトと画像をできるだけ流用してます。
生成時間は前作と変わってなかったのでカットします。

プロンプト1

見渡す限りのひまわり畑の中に佇む美少女。風になびく長い髪、背景には夏の巨大な入道雲と透き通るような青空。繊細な光の表現と鮮やかな色彩。キラキラとした瞳、ドラマチックな構図、幻想的な夏の思い出。

Qwen-Image-2512

Qwen-Image

プロンプト2

前のやつからコピーして思ったけどこれ前のひまわり畑のやつと合体してたのね(これは直しました)

幻想的な水族館。巨大なアクリルパネルの大水槽の前に佇む美少女。深い青とエメラルドグリーンの光が彼女を照らし、水槽の中ではジンベエザメやマンタ、色鮮やかな魚の群れが渦を巻いて泳いでいる。水面から差し込む光の柱(チンダル現象)と、キラキラと輝く無数の泡。少女は感動して水槽を見上げている。繊細で透明感のある背景美術、ドラマチックな構図、鮮烈な色彩。圧倒的な没入感。

Qwen-Image-2512

Qwen-Image

プロンプト3

神聖で幻想的な夜の神社。無限に続く赤い鳥居のトンネル。宙に浮く無数の狐火(きつねび)や灯籠の温かいオレンジ色の光。豪華な着物を着た銀髪の美少女が、振り返っている。周囲には蛍が舞い、森の木々が静かに見守っている。神秘的で静寂な雰囲気、魔法のような光の演出、高精細な描写。

Qwen-Image-2512

Qwen-Image

プロンプト4

ここで少し差が出てますが環境によってLoraが崩れることがあったのですがいい感じになってますね

水着の女性がプールにいる。

Qwen-Image-2512

Qwen-Image

プロンプト5

なんとなく3枚生成したので3枚貼っておきます。
プロンプトは例です。
少しいじったりしてます。

1girl,solo,animal ears,brond hair,short hair,sleeveless,elbow gloves,socks,extra ears,sleeveless_shirt,skirt,belt,tail,yellow_eyes,serval,bowtie,arms up,shoe,savannah,scary smile

Qwen-Image-2512

Qwen-Image

プロンプト6

プロンプトをメモり忘れましたが2512が私の作成したLora的には忠実です。
あと指の数を見たらわかるのですが明らかに本数が増える現象が解消されてます。

Qwen-Image-2512

Qwen-Image

結論

めちゃくちゃ変わったかと言われればLoraを適用すると違いはよくわかりませんがLora適用時に指が増える現象は明らかにへってました。
プロンプト6を見てもらえればわかります(まぁ、前の状態でもネガティブプロンプトとかで直せるんですけども)

あとはヴィタちゃんLoraを作ってから比較して学習データなどを増やしてみるか決めたいと思います。

Intel Arc Pro B60 48GB(24GB x2)でllama 3.3 70bを動かす

· 約1分
もみじーな
個人開発者

Intelのドライバーをダウングレードしたらエラーがでないと聞いたのでテストだけしました。

まぁなんといいますか

はい、5token/sから7token/sです。

コンテキスト長増やしてQwen3 Coder用にすることにします。

さようなら70b

50bくらいのMoEモデルがでればまぁ使うかなって感じですかね。

もう来年でるという噂の32GBのArc Proに期待しておきます。

またはインテルの160GBのCrescent Islandが50万以下なら買いますがまぁ・・・

Intel Arc Pro B60 48GB(24GB X2)を試してみただけ

· 約2分
もみじーな
個人開発者

Intel Arc Pro B60 24GBの2枚目が届いてしまったのでそのテストをしてみました。

ARC Pro B60 Dual 48G TurboっていうGPUもありますがあれは48GBをうたっていますが実際の認識は24GBが2つタスクで認識されるらしいので同じはずです。

LM Studioで認識はこんな感じでちゃんと認識はしてくれました。

一応、gpt-oss 20bを分割ロードしてみましたが1枚と差はなさそうです。(54token/s)

そしておそらくですが現在,LM StudioのVulkanで2枚で動かしたりすると一定メモリ以上でなぜかエラーが出てるのでバグってますね・・・

せっかくQwenとかためしたかったのですが分割すると14bですらエラーがでて試せなかったです。

なのでまた今度、試して見ますが最適化も恐らく不足してますよね。

EVO-X2でgpt-oss 20bが40tokenくらいでるという情報を見たことがあるのでもう少しでると信じてますがどうなんですかね

gpt-oss 20bは問題なくコンテキストもMAXにしてもエラーがなかったのでVulkanに問題があると考えますがLM Studioに問題があるかもしれないので後でOllamaかllamaをインストールしてみます。

来年,RTX 50 Superが出たら載せ替えるかもしれないですがそれまでは色々テストしてみます。

Intel Arc Pro B60 24GBのゲームベンチマークとか

· 約1分
もみじーな
個人開発者

Intel Arc Pro B60 24GBが届きましたの軽くWindowsでゲームのベンチマークテストとLM Studioでの速度テストしてます。

面倒だったので適当に編集してyoutubeにアップロードしましたがやっぱりRTX5050くらいですねゲーム性能は

最適化不足の可能性もありますがRTX5090ってすごいんだなと実感しました。

gpt-oss 20bでRTX5090が272.52token/sでArc Pro B60は54token/sです。

帯域速度差的に確かにこんなもんですがあとは70Bモデルがどれくらいの速度が出てくれるかですが

また、2枚目来たらテストしてみます・・・

Intel Arc Pro B60 24GBの在庫が復活?

· 約1分
もみじーな
個人開発者

Intel Arc Pro B60 24GBの在庫が一部復活してるみたいです!

私の分もソフマップから出荷が開始されました。

そして追加注文もできましたね・・・

注文番号はつぶしてます

とこれを書いている間にまたお取り寄せになってるので在庫を狙っている方はキャンセルなど狙ってみてください。

在庫をねらっているそんな人は存在するのかは疑問ですが・・・(RTX5050以下のゲーム性能)

Intel信じてるぞ?

PDF編集ウェブアプリをAIと作成してみた

· 約2分
もみじーな
個人開発者

PDF編集ウェブアプリを作成

タイトル通りです。

PDF編集ウェブアプリをGoogle AI StudioとClaude4.5を使って開発してみました。

今回作成したもの

こちらがデモサイトになります。
PDFエディター
ビルドしてConoHaWingにアップロードしてますがまぁ問題なさそうですね。

Githubにコード全部保存してるので必要があれば変更してください・・

サンプルPDFもおいておきます。

作成した理由とか

作成理由ですがPDFの並べ替えをしたかっただけというのが理由ですね・・・
さすがにたった一つのPDFの為にPDFソフト買うのもあれですしインストールもなんかしたくなかったので最悪ローカルで動かしておけそうなものを今後も使えるように作ってみました。

オンラインPDFもアップロードしてないと書いてても怖くないですか?

Githubでウェブ動作のオープンソースが公開されていないかなと思ったんですが意外とないんですよねこれが

本当は入れ替えだけでよかったのですが一応、たくさん機能つけたので公開しておきます。

バグも放置してるので誰かが直してくれることを願ってますが一応、暫くは軽く修正だけするかもしれないです。

サムネイル生成の画質を低くしてますが4Kモニターで見ると粗かったので修正はするかもです。

あとでExmentのプラグインとしても作るかもしれないですがPDF編集ウェブアプリも結構簡単に作れるレベルにAIが進化したと思うと感動ですよね。

一応ですが作成時間は4-5時間程度です。

LM Studio用の低消費電力PCを組むぞ(GPUだけ届かない)

· 約3分
もみじーな
個人開発者

※今回、購入理由は低消費電力なデュアルGPUをテストするためです。
ローカルAIはまだ特別な理由がない限り勧めしません(金の無駄)(画像生成は例外 5060ti 16GBが入門におすすめ)
あとLM Studio用とは書いてますが多分,llama.cppかOllamaで運用します。


とりあえずPCパーツは買い揃えました。

そしてArc Pro B60 24GBは1枚だけこの前に購入しましたがくる気配はありませんね。

できれば年内来てほしいです。

年末に遊ばせてください・・・

テストしてないので抵抗がありますが来週も来ないようならもう1枚追加注文はする予定ですが本当に買ってよいものか中古のRTX3090を2枚買った方が幸せだったのではないか7900xtxをもう1枚買えばよかったのではないか?

しかしもうパーツは買い揃えました止まることなどできないのです。

どうせ7900xtxもRTX3090もx8/x8だと処理能力落ちますし・・・

そして買ったものが以下です・・・

前のプランと少し変わってます。

買ったものリスト

カテゴリー製品名価格
ケースP20C11,970
マザーボードZ890 VALKYRIE35,780
CPUCore Ultra 5 22523,980
メモリCMH32GX5M2B5600C40K38,980
電源TOUGHPOWER GT/1200W ATX 3.123,676
M.2WD Blue SN5000 NVMe SSD WDS100T4B0E8,903
GPUArc B60 24GB120,000
FANMAG COREFROZR AA133,933
グリスJP-DX11,280

合計268,502円でした。(プラス120,000になる予定)

6月頃組んだUltra 7 265K PCと比べてもやっぱりメモリが高いので少し高く感じますね。

これでもクーポンとか色々適用したんですけどね・・・・

組み立てはGPUが届くまでに適当にやっておきますが次回は組んだからテストするぞで始まることを祈ります。

早く届いてくれーーー

一応、写真貼っておきます。

組み立てだけしました

2日後くらいに組み立てだけしました。
ケースとマザーボードの相性が多分悪かったですが無事biosまで確認しました。
PCの上に使わずにおいてたHuionのディスプレイを使ったのでほこりで画面が汚いですね・・・
グリスも結局使わなかったです。
MSIのファンに最初から塗ってあった分で十分ひえてそうです。
画像ではCPUファンがOPTにささってますが気にしないで・・・ あとケースに背面ファンがなかったので後で追加します。

Z-Image-TurboのLora作ったからQwen-Imageと比較するぞ

· 約7分
もみじーな
個人開発者

2025年12月1日に追記してます。
画像追加してます。
微妙ですねQwen-Imageのほうがいいです。
Z-Image-Turboは安定しない場合は英語でプロンプトを考える必要があるかもですね。
2025年12月4日に最後にStable Diffusionで使うプロンプトでのテストを追加してます。


Z-Image-TurboのLoraを作りましたのでQwen-Imageと比較したいと思います。

今回は1920x1088の20ステップでのそれぞれの比較とします。

プロンプトはGemini 3.0 Pro生成です。

Z-Image-TurboのLoraの作成方法

一応、書いておきます。

今回,Lora作成にはQwen-Imageと同じくai-toolkitを使用しています。

https://github.com/ostris/ai-toolkit

RTX50シリーズだと以下で動きます。
RTX5090で今回もZ-Image専用で再インストールしているので問題ないです。

git clone https://github.com/ostris/ai-toolkit.git
cd ai-toolkit
python -m venv venv
.\venv\Scripts\activate
pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu128
pip install -r requirements.txt

起動

cd ui
npm run build_and_start

一回,buildした後は以下のほうが起動が早いです。

cd ui
npm run start

トリガーワードとかは特に今回はなしです。

一応、全体的な設定はこんな感じです(クリック拡大できるようにしときます)

Lora作成時間は1時間ちょうどくらいでしたね。

比較するぞ

プロンプト1

プロンプト1は以下です。

見渡す限りのひまわり畑の中に佇む美少女。風になびく長い髪、背景には夏の巨大な入道雲と透き通るような青空。繊細な光の表現と鮮やかな色彩。キラキラとした瞳、ドラマチックな構図、幻想的な夏の思い出。

Qwen-Image

Z-Image

プロンプト2

プロンプト2は以下です。

幻想的な水族館。巨大なアクリルパネルの大水槽の前に佇む美少女。深い青とエメラルドグリーンの光が彼女を照らし、水槽の中ではジンベエザメやマンタ、色鮮やかな魚の群れが渦を巻いて泳いでいる。水面から差し込む光の柱(チンダル現象)と、キラキラと輝く無数の泡。少女は感動して水槽を見上げている。繊細で透明感のある背景美術、ドラマチックな構図、鮮烈な色彩。圧倒的な没入感。見渡す限りのひまわり畑の中に佇む美少女。風になびく長い髪、背景には夏の巨大な入道雲と透き通るような青空。繊細な光の表現と鮮やかな色彩。キラキラとした瞳、ドラマチックな構図、幻想的な夏の思い出。

Qwen-Image

Z-Image

プロンプト3

プロンプト3は以下です。

神聖で幻想的な夜の神社。無限に続く赤い鳥居のトンネル。宙に浮く無数の狐火(きつねび)や灯籠の温かいオレンジ色の光。豪華な着物を着た銀髪の美少女が、振り返っている。周囲には蛍が舞い、森の木々が静かに見守っている。神秘的で静寂な雰囲気、魔法のような光の演出、高精細な描写。

Qwen-Image

Z-Image

プロンプト4

プロンプト4は以下です。

春、緑に覆われた古い廃線跡(鉄道のレール)。トンネルの出口付近で、満開の桜がアーチのように咲き誇っている。制服を着た少女が枕木の上をバランスを取りながら歩いている。舞い散る花びら、木漏れ日、錆びた鉄と新緑のコントラスト。ノスタルジックで爽やかな空気感。

Qwen-Image

Z-Image

追加比較と一部不安定?

パラメーターが少ない分一部動作が不安定でした。
LoraはQwen-Imageも同じデータ、同じステップでやっているのでだいたいは似たのができるはずだった。
まぁLora適用しなくても不安定だったのでもしかしたら日本語プロンプトがいけない可能性もあるので英語でやってみましたが微妙でしたね・・・
よくよく考えればプロンプト4も絵柄が違いますもんね。

東京タワー

Qwen-Image

Z-Image

Loraの強度を強くしてこれです

水着を着た初音ミクがプールで泳いでいる。

Qwen-Image

Z-Image

一部、動作をさせるとLoraの安定性もわるくなります。
野球させても意味がわからなかったです。 Lora適用時の水の描写が苦手なのかな

初音ミクがベッドで寝ている

Z-Imageだけ

水着の女性がプールにいる。

Qwen-Image

Z-Image

女性が一人,こちらに向かってピースしている

Qwen-Image

Z-Image

Loraもうあきらめきってますがピースサインくらいは・・・
これ生成されたものの中でましなものなんですよ?

一応英語だとこんな感じのが生成されます

A woman is making a peace sign toward us.

そのグーなんだよ。
英語でやらないといけないならStable Diffusionでいいので現状は使うことはないです。

Stable Diffusion風プロンプト

ベースを以下にして適当にいじって遊んでました。

1girl,solo,animal ears,brond hair,short hair,sleeveless,elbow gloves,socks,extra ears,sleeveless_shirt,skirt,belt,tail,yellow_eyes,serval,bowtie,arms up,shoe,savannah,scary smile

Qwen-Image

Z-Image

Loraが不安定なのは学習に問題がある可能性もあるのでai-toolkitの更新を待ってみますかね一応・・・
V2データでの学習ですがあんまり変わってなかったです。 プロンプトを増やしてポーズさせるとなぜか場所がうまくでなかったりしますねやっぱ

結論

Lora使えばあんまりかわらなそう?
一応、最後に生成に使った画面をそれぞれ張っておきますが速度が圧倒的にZ-Imageは速いです50秒と18秒で同じそうならZ-Image一択ですかね。
4stepにすれば速度はさらに早いです。
この流れだとZ-Image-Turbo-Editもくるのかな?

追記コメント:微妙!使えるならQwen-Imageのほうがいいです。
Civitaiに転がってるモデルでも同じだったのでまぁもういいです。
細かいことさせるとどこで崩壊するかわかないのでQwen-Imageを使うのがいいですね。
英語でやる必要があるならStable Diffusionを使います。