メインコンテンツまでスキップ

Intel Arc Pro B60の環境を調整したから70bから20bまでテストするぞ

· 約3分
もみじーな
個人開発者

Intel Arc Pro b60の再計測です。

買う方がいるならまぁ参考に・・・

Intel Arc Pro B60 24GBの在庫はどこにいったんですかねこれ

llama-3.3-70bを計測する

短い質問

まず少し古いですがいいのがなかったのでこの70bモデルです。
まず短い質問で9.79token/sでした。

500文字程度の生成はどうか?

8.47token/sです。
文章をつくるだけなら問題ないくらいの速度ですかね

かなり長いコードを生成させる

6.41token/sと前よりもはね?

HyperNova-60bを計測する

最近でたばっかりのgpt-oss 120b関連のモデルらしい?

短い質問

見てくださいこの速度
62token/sです。

500文字程度の生成はどうか?

かなり長いコードを生成させる

44token/sとかなりいい速度がでてますがこのモデルのコード生成は微妙でしたね・・・

※このモデルはまだ微妙

日本語も微妙です5000文字で物語を指定したら日本語と英語がまざりました。

Qwen3 Coder 30b a3bを計測する

短い質問

30bのa3bなら85token/sもでます。

かなり長いコードを生成させる

コードモデルなので500文字はカットしてます。
36token/sです。

コンテキスト長を20万トークンにしてみる

さすが20万トークンですね
40GB近くロードされます。(分割ロードなので)

1回目の速度は問題ないですが使えて5万トークンくらいかもしれないですね・・・

gpt-oss-20bを計測する

短い質問

73token/sです。

500文字程度の生成はどうか?

70token/sと悪くないですね。

最後に

いかがでしょうか48GBで24万ならわりとありなんじゃないかと思える速度だったのではないかと思いますがRTX5090とどうしても比べてしまって遅く感じてしまいます。
それにまだ最適化がすんでいないのでgpt-oss-20bも最適化によっては90token/sは出る気がするのでIntelさん早くお願いします。

llama.cppなら現状でも+20%くらいでたはずなのとRyzen AI Max+ 395 128gbですらgpt-oss-20bで60くらいでるらしいので1.5倍は帯域的にでるだろうという計算です。

Ryzen AI Max+ 395 128gbもMSIから搭載PCがでるらしいので日本で発売されるようなら比較してみたいです。

Qwen-Image-2512をArc Pro B60で試したら遅かった

· 約2分
もみじーな
個人開発者

※1月12日に生成速度結果について少し追記しました。


HyperNova 60Bというモデルのテストするついでに試してますがタイトル通りです。

遅いです。

生成はできますがさすがに5090をこれは使います・・・

そもそもIntel GPUのComfyUIの入れ方を調べるのめんどくさかったのでAI Playgroundについてるじゃんと思ってそれを使っているのでこれで遅くなっている可能性はありますがね・・・

生成テスト結果

設定は私の好きな20stepの解像度は1920x1088です。
Loraは現在、テストで作成中のものをつかっています。
1生成が445秒はさすがに遅いです。

2枚目の生成なら変わるかと思い連続でやりましたがあんまりかわらず。
確かに427秒と短くなってますが誤差ですよねこれもう

追記してます。
結局、設定見直したりしたら20stepでも360秒程度になりました まぁ、1枚360秒はさすがに遅いのに変わりはないですけども

一応,Lightningを使って4stepと8stepでテストしましたが画質が微妙です。
4stepが205秒、8stepが265秒って感じですね。
やっぱり20stepはほしい。
Lightningも確かに4,8stepである程度きれいになるんですけど画質はかなり落ちてます。
つけたとしても20stepにします・・・

20stepで生成した画像だけ1枚貼っておきます。

1024*1024の生成テストも追加で貼っておきます。
270秒まで縮みます。

Intel Arc Pro B60でもやっぱりQwen-Imageレベルは遅いですね。

ただ動かせるのでfp8版が動かしたいだけの方にはIntel Arc Pro B60は選択肢に入るのかもしれないですね。

一応,最後に生成中のメモリ使用率です。
1枚目のIntel Arc Pro B60で生成してます。

Z-Image-TurboをArc Pro B60で試してみただけ(案外早い?)

· 約2分
もみじーな
個人開発者

去年,Arc Pro B60 24GBを2枚買ってRTX5090とは別で運用してますが案外気に入っています。

Windowsで運用するならとても静かですね。

Ubuntuだとファンコントローラーが死ぬので少し音が気になります。

と話がずれてましたがArc Pro B60 24GBでZ-Image-Turboをテストだけしました。

問題なく動いたので今後のIntel製品には本当に期待してます。

Arc Pro B60でComfyUIのZ-Imageを動かす

ComfyUIですがIntelのGPUでインストールする方法はとても簡単でした。

IntelからでてるAI Playgroundというソフトをインストールするだけで簡単にインストールできました。

ComfyUIの開き方は画像のよう設定からOpen ComfyUI押すだけです。

Pythonすらインストールしてないけど

どうやって動いているのかは不明です。

インストール後にCMDでPython確認しても反応はなかったので仮想的に動いているんですかね?

モデルファイルの配置方法は基本的に他と同じですがAI Playgroundのインストール先をファイルの場所を開くで開いてそこに入れたらいけました。

Z-Image-TurboをArc Pro B60でテストする

今回は2枚目のArc Pro B60を使ってテスト生成してみましたが問題なさそうです。

1920x1088の20Stepで60秒って感じです。
案外早いですよねこれ?

一応、生成した画像を何枚か貼っておきますがLoraが強すぎて手が微妙になってます。
Z-Imageだと私のLoraは強度1だとなぜか不安定なんですよね。(0.8-0.9で安定)

Qwen-Image 2512も暇だったら試します。

Qwen-Image-2512のLoraができたからQwen-Imageと簡単な比較してみただけ

· 約7分
もみじーな
個人開発者

Qwen-Image-2512が出ましたね・・・・

Loraがそのまま使えると思ったのですがね・・・

ダメでしたので作り直しました。

前のやつの修正版なのもあり何かが変わったわけではないので簡単な比較です。
(人などがリアルになったり細かい描写の修正らしいですがLoraメインの私には人がリアルになってもあまり・・・)

あとは結局,Z-ImageもQwenもそうですがNSFWが微妙なんですよね。

それもあって結局、みんなStable Diffusionですよね。

そろそろ規制解除版でたのかな?

一応、結論を書いておきますがLora適用時の安定性が少し増していました。

もしかしたらai-toolkitのLora作成用データが良くなっただけの可能性もありますが後でヴィタちゃんLoraを作成して考えます。

Qwen-Image-2512のLoraの作成方法

一応、書いておきます。

今回,Lora作成にはQwen-Image,Z-Imageと同じくai-toolkitを使用しています。

https://github.com/ostris/ai-toolkit

RTX50シリーズだと以下で動きます。
RTX5090で今回もQwen-Image-2512専用で再インストールしているので問題ないですがもしかしたらそろそろtorchが新しくでてるかもしれなです。
面倒くさいので確認してないので安定性を求める方は最新版がでてないか確認してみてください。

git clone https://github.com/ostris/ai-toolkit.git
cd ai-toolkit
python -m venv venv
.\venv\Scripts\activate
pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu128
pip install -r requirements.txt

起動

cd ui
npm run build_and_start

一回,buildした後は以下のほうが起動が早いです。

cd ui
npm run start

簡単なai-toolkit設定画面の説明

New Jobでだいたい以下の設定にしてもらえれば動きます(ai-toolkit公式からのおすすめです。)
3bit with ARAが24GB推奨です。
4bit with ARA が32GB推奨です。
私は5090なので4bitでいいはずですが余裕を持たせるために一応3bitにしてみてます。
名前やステップ数も自由に変更してください。
私は3000stepにしてますが1500stepの方が人気な気もします。
ここでは見えないですがさらに下にサンプルプロンプトの設定がありますがお好みです。
精度があがりますが面倒くさいので私はだいたいそのままにしてますね

あとはCreate Jobして開始するだけです・・・
開始した後のインストールが長いです。
新しいやつが出るたびに再インストールしているせいでSSDがどんどん埋まっていくので対策を考え中です。

前のLoraを使ってみた

プロンプトは以下です(適当)

カフェで女性がコーヒーを飲んでいる

見てください前のLoraは完全に死にました。

新しいLoraをテストする

プロンプト1

プロンプトは前のLoraと同じです。

カフェで女性がコーヒーを飲んでいる

いい感じですね。
やっぱりQwen-Imageってプロンプトが同じだと似た構図になりますよね?
Stable Diffusionはランダム要素があって好きだったんですけどね・・

プロンプト2

動物園でパンダがこちらを見ている

まぁ、パンダって感じです。
そもそも学習データに動物を含ませてないのでちゃんと出ているのかは不明

前作のQwen-Imageと簡単に比較してみる

Z-Imageの時に使ったプロンプトと画像をできるだけ流用してます。
生成時間は前作と変わってなかったのでカットします。

プロンプト1

見渡す限りのひまわり畑の中に佇む美少女。風になびく長い髪、背景には夏の巨大な入道雲と透き通るような青空。繊細な光の表現と鮮やかな色彩。キラキラとした瞳、ドラマチックな構図、幻想的な夏の思い出。

Qwen-Image-2512

Qwen-Image

プロンプト2

前のやつからコピーして思ったけどこれ前のひまわり畑のやつと合体してたのね(これは直しました)

幻想的な水族館。巨大なアクリルパネルの大水槽の前に佇む美少女。深い青とエメラルドグリーンの光が彼女を照らし、水槽の中ではジンベエザメやマンタ、色鮮やかな魚の群れが渦を巻いて泳いでいる。水面から差し込む光の柱(チンダル現象)と、キラキラと輝く無数の泡。少女は感動して水槽を見上げている。繊細で透明感のある背景美術、ドラマチックな構図、鮮烈な色彩。圧倒的な没入感。

Qwen-Image-2512

Qwen-Image

プロンプト3

神聖で幻想的な夜の神社。無限に続く赤い鳥居のトンネル。宙に浮く無数の狐火(きつねび)や灯籠の温かいオレンジ色の光。豪華な着物を着た銀髪の美少女が、振り返っている。周囲には蛍が舞い、森の木々が静かに見守っている。神秘的で静寂な雰囲気、魔法のような光の演出、高精細な描写。

Qwen-Image-2512

Qwen-Image

プロンプト4

ここで少し差が出てますが環境によってLoraが崩れることがあったのですがいい感じになってますね

水着の女性がプールにいる。

Qwen-Image-2512

Qwen-Image

プロンプト5

なんとなく3枚生成したので3枚貼っておきます。
プロンプトは例です。
少しいじったりしてます。

1girl,solo,animal ears,brond hair,short hair,sleeveless,elbow gloves,socks,extra ears,sleeveless_shirt,skirt,belt,tail,yellow_eyes,serval,bowtie,arms up,shoe,savannah,scary smile

Qwen-Image-2512

Qwen-Image

プロンプト6

プロンプトをメモり忘れましたが2512が私の作成したLora的には忠実です。
あと指の数を見たらわかるのですが明らかに本数が増える現象が解消されてます。

Qwen-Image-2512

Qwen-Image

結論

めちゃくちゃ変わったかと言われればLoraを適用すると違いはよくわかりませんがLora適用時に指が増える現象は明らかにへってました。
プロンプト6を見てもらえればわかります(まぁ、前の状態でもネガティブプロンプトとかで直せるんですけども)

あとはヴィタちゃんLoraを作ってから比較して学習データなどを増やしてみるか決めたいと思います。

Intel Arc Pro B60 48GB(24GB x2)でllama 3.3 70bを動かす

· 約1分
もみじーな
個人開発者

Intelのドライバーをダウングレードしたらエラーがでないと聞いたのでテストだけしました。

まぁなんといいますか

はい、5token/sから7token/sです。

コンテキスト長増やしてQwen3 Coder用にすることにします。

さようなら70b

50bくらいのMoEモデルがでればまぁ使うかなって感じですかね。

もう来年でるという噂の32GBのArc Proに期待しておきます。

またはインテルの160GBのCrescent Islandが50万以下なら買いますがまぁ・・・

Intel Arc Pro B60 48GB(24GB X2)を試してみただけ

· 約2分
もみじーな
個人開発者

Intel Arc Pro B60 24GBの2枚目が届いてしまったのでそのテストをしてみました。

ARC Pro B60 Dual 48G TurboっていうGPUもありますがあれは48GBをうたっていますが実際の認識は24GBが2つタスクで認識されるらしいので同じはずです。

LM Studioで認識はこんな感じでちゃんと認識はしてくれました。

一応、gpt-oss 20bを分割ロードしてみましたが1枚と差はなさそうです。(54token/s)

そしておそらくですが現在,LM StudioのVulkanで2枚で動かしたりすると一定メモリ以上でなぜかエラーが出てるのでバグってますね・・・

せっかくQwenとかためしたかったのですが分割すると14bですらエラーがでて試せなかったです。

なのでまた今度、試して見ますが最適化も恐らく不足してますよね。

EVO-X2でgpt-oss 20bが40tokenくらいでるという情報を見たことがあるのでもう少しでると信じてますがどうなんですかね

gpt-oss 20bは問題なくコンテキストもMAXにしてもエラーがなかったのでVulkanに問題があると考えますがLM Studioに問題があるかもしれないので後でOllamaかllamaをインストールしてみます。

来年,RTX 50 Superが出たら載せ替えるかもしれないですがそれまでは色々テストしてみます。

Intel Arc Pro B60 24GBのゲームベンチマークとか

· 約1分
もみじーな
個人開発者

Intel Arc Pro B60 24GBが届きましたの軽くWindowsでゲームのベンチマークテストとLM Studioでの速度テストしてます。

面倒だったので適当に編集してyoutubeにアップロードしましたがやっぱりRTX5050くらいですねゲーム性能は

最適化不足の可能性もありますがRTX5090ってすごいんだなと実感しました。

gpt-oss 20bでRTX5090が272.52token/sでArc Pro B60は54token/sです。

帯域速度差的に確かにこんなもんですがあとは70Bモデルがどれくらいの速度が出てくれるかですが

また、2枚目来たらテストしてみます・・・

Intel Arc Pro B60 24GBの在庫が復活?

· 約1分
もみじーな
個人開発者

Intel Arc Pro B60 24GBの在庫が一部復活してるみたいです!

私の分もソフマップから出荷が開始されました。

そして追加注文もできましたね・・・

注文番号はつぶしてます

とこれを書いている間にまたお取り寄せになってるので在庫を狙っている方はキャンセルなど狙ってみてください。

在庫をねらっているそんな人は存在するのかは疑問ですが・・・(RTX5050以下のゲーム性能)

Intel信じてるぞ?

PDF編集ウェブアプリをAIと作成してみた

· 約2分
もみじーな
個人開発者

PDF編集ウェブアプリを作成

タイトル通りです。

PDF編集ウェブアプリをGoogle AI StudioとClaude4.5を使って開発してみました。

今回作成したもの

こちらがデモサイトになります。
PDFエディター
ビルドしてConoHaWingにアップロードしてますがまぁ問題なさそうですね。

Githubにコード全部保存してるので必要があれば変更してください・・

サンプルPDFもおいておきます。

作成した理由とか

作成理由ですがPDFの並べ替えをしたかっただけというのが理由ですね・・・
さすがにたった一つのPDFの為にPDFソフト買うのもあれですしインストールもなんかしたくなかったので最悪ローカルで動かしておけそうなものを今後も使えるように作ってみました。

オンラインPDFもアップロードしてないと書いてても怖くないですか?

Githubでウェブ動作のオープンソースが公開されていないかなと思ったんですが意外とないんですよねこれが

本当は入れ替えだけでよかったのですが一応、たくさん機能つけたので公開しておきます。

バグも放置してるので誰かが直してくれることを願ってますが一応、暫くは軽く修正だけするかもしれないです。

サムネイル生成の画質を低くしてますが4Kモニターで見ると粗かったので修正はするかもです。

あとでExmentのプラグインとしても作るかもしれないですがPDF編集ウェブアプリも結構簡単に作れるレベルにAIが進化したと思うと感動ですよね。

一応ですが作成時間は4-5時間程度です。

LM Studio用の低消費電力PCを組むぞ(GPUだけ届かない)

· 約3分
もみじーな
個人開発者

※今回、購入理由は低消費電力なデュアルGPUをテストするためです。
ローカルAIはまだ特別な理由がない限り勧めしません(金の無駄)(画像生成は例外 5060ti 16GBが入門におすすめ)
あとLM Studio用とは書いてますが多分,llama.cppかOllamaで運用します。


とりあえずPCパーツは買い揃えました。

そしてArc Pro B60 24GBは1枚だけこの前に購入しましたがくる気配はありませんね。

できれば年内来てほしいです。

年末に遊ばせてください・・・

テストしてないので抵抗がありますが来週も来ないようならもう1枚追加注文はする予定ですが本当に買ってよいものか中古のRTX3090を2枚買った方が幸せだったのではないか7900xtxをもう1枚買えばよかったのではないか?

しかしもうパーツは買い揃えました止まることなどできないのです。

どうせ7900xtxもRTX3090もx8/x8だと処理能力落ちますし・・・

そして買ったものが以下です・・・

前のプランと少し変わってます。

買ったものリスト

カテゴリー製品名価格
ケースP20C11,970
マザーボードZ890 VALKYRIE35,780
CPUCore Ultra 5 22523,980
メモリCMH32GX5M2B5600C40K38,980
電源TOUGHPOWER GT/1200W ATX 3.123,676
M.2WD Blue SN5000 NVMe SSD WDS100T4B0E8,903
GPUArc B60 24GB120,000
FANMAG COREFROZR AA133,933
グリスJP-DX11,280

合計268,502円でした。(プラス120,000になる予定)

6月頃組んだUltra 7 265K PCと比べてもやっぱりメモリが高いので少し高く感じますね。

これでもクーポンとか色々適用したんですけどね・・・・

組み立てはGPUが届くまでに適当にやっておきますが次回は組んだからテストするぞで始まることを祈ります。

早く届いてくれーーー

一応、写真貼っておきます。

組み立てだけしました

2日後くらいに組み立てだけしました。
ケースとマザーボードの相性が多分悪かったですが無事biosまで確認しました。
PCの上に使わずにおいてたHuionのディスプレイを使ったのでほこりで画面が汚いですね・・・
グリスも結局使わなかったです。
MSIのファンに最初から塗ってあった分で十分ひえてそうです。
画像ではCPUファンがOPTにささってますが気にしないで・・・ あとケースに背面ファンがなかったので後で追加します。