メインコンテンツまでスキップ

Qwen-Imageようの僕の考えた最強のスタイルLoraが完成したぽん

· 約2分
もみじーな
個人開発者

求めていた画像が出せるスタイルLoraを完成させることができたぽん(前回の続きなので)

↑プロンプト(白いワンピースの女性がひまわり畑に一人,麦わら帽子をかぶっている,る,momijiina_style,vita20250824)

若干前と違いますがこれは女性、女の子,お姉さんなどでQwen Imageではだいぶ変わるからみたいです。(loraの強度も)

プロンプトを調整すればおそらく近づけることができると思うのでこれでStable Diffusionを最悪捨ててQwen Imageへ移行することができます・・・・

この結果からアニメ特化のモデルは不要そうです。

これで次はヴィタちゃん、セナディアちゃんに続く,セルマやアカリなどのQwen Image用のLoraを作り始めることができそうです。

学習用に500枚も画像を用意した甲斐がありました。

このスタイルLoraの配布は現状,考えてないですが需要がありそうならCivitaiとかにアップロードしときます・・・

Qwen ImageのいいところはStable Diffusionでキャラが遠い場合に目や顔が崩れることでしたがこれで克服できそうです。

こんな感じのが生成できました。

水族館の表現もだいぶいい感じじゃないですか?
(服装を指定しなかったせいか防弾チョッキみたいなのきてる?なにこれ)

Qwen-Imageように目的のLoraを作ったけどなんか違う

· 約1分
もみじーな
個人開発者

Qwen-Imageように崩壊3rdのヴィタちゃんのLoraを作成しましたが求めた結果はまだ得られませんでした。

(プロンプトなど色々試していくうちに生成時間は平均50秒くらいになりました。)

上のように問題なくloraを作り生成できましたが違う・・・・

私が求めている画像はこんな感じです↓

(Stable Diffusionで作りました)

チェックポイントの関係もあると思うのでアニメ系のモデルがでるまで待つしかなさそう・・

スタイルloraをつくるしかないか独自モデルを作るしかないか・・・

私の出す解は既に収束してしまったのでもっと情報が増えたら再開します。

もうダメだぽん

Qwen-Imageで作成した画像(プロンプトはすべて若干違います)↓

Qwen-Image-EditはAIイラストレーターの救世主?

· 約1分
もみじーな
個人開発者

Qwen-ImageようにヴィタちゃんのLoraを作成するための素材を作成中にふと思ったのですが
生成した画像がどうしても手の数が不自然だったりして同じシードにして再生成しても絵が変わったり・・・

そこでQwen-Image-Editで確認した画像を修正できるようにワークフローを作成したのですがこれは革命でした。

これは画像の例ですが

こうなることがあります。

こうなると見た目はすごくいいのに再生成してみるか削除することになります。

しかし,ワークフローでやる必要はないですが生成した画像をQwen-Image-Editで修正すればさっきの画像がこうなります。

これはだいぶ助かります。

これで画像の再生成や削除がいらなくなり品質の高い画像が・・・

こまったらQwen-Image-Editです。

Qwen-Imageは安定性が最高かもLoraも作ってみた

· 約3分
もみじーな
個人開発者

Qwen-Imageの安定性がすごいという話を聞いたので試して見ました。

今回、試すにあたり崩壊3rdのセナディアLoraをQwen-Imageように作成してみました。

学習に使用したツールはAI-Toolkitです。(5090なら4090のたぶん2倍程度の速度で学習できます。)

学習完了画面(3-4時間くらいかかりました) 学習完了画面

学習に使用した画像はStableDiffusionで作成しました。(学習素材は1080x1920メインです)

Qwen-Imageのフローは公式フローを使っています。(高速化loraを使い忘れてますがきにしないでください。)

使ったプロンプト(女の子が一人,senadia,前に向かってピースしている)

すごいです日本語で入力できます。
さらに背景を追加してみます。

使ったプロンプト(女の子が一人,senadia,前に向かってピースしている,背景は日本の街並み)

服装も変えてみる

使ったプロンプト(女の子が一人,senadia,前に向かってピースしている,背景は日本の街並み,服装はメイド服)

これはさようならStable Diffusionでは・・・
最後に画像サイズを大きくして水彩画にしています。
高速化loraを使わなくても30秒かからなかったです。(1920x1088で少しミスってますが問題なし)

日本語が使えるのはでかすぎます現状、LoraやCheckpointが出たばっかでほぼないですがこれから増えるならいい選択肢です。

Lora作ればこれでよさそう。

Fluxみたいに1枚の画像からLoraつくっても安定するのかも気になります。

最終生成画像だけ貼っておきます。(これはクリックできます) 崩壊3rd セナディア 崩壊3rdのセナディアちゃんですぜひプレイしてみてください。

AIアートのページで崩壊3rdのキャラで色々テストしてましたがキャラが遠くなったりすると安定性が悪かったので代替を探していたのですが安定性がよさそうならヴィタちゃんもLoraつくろうかな

Qwen-Image-Editはだいぶよさそう

· 約2分
もみじーな
個人開発者

Qwen-Image-Editが出てたので試して見ましたがすごくよかったです。

試してみるだけだったので今回はNoteに公開されていたフローを使っています。

参考にしたNote(ComfyUIでQwen-Image-Editを試す(FP8版、Lightning使用) )

上の画像の通り白背景の女の子の画像だけで背景から服装まで日本語で指定できてしまいました。(画像のキャラクターは崩壊3rdのセナディアというキャラです。)

画像生成は始めたばっかなので詳しくないですがこれならloraを作る必要が今後なくなりそうです。

1枚画像があれば好きなキャラを好きなポーズに変更できそうです。

Fluxように崩壊3rd用のLoraを作ろうかと思ってたけど時間がかかりすぎるので止まってたのでこれは使えそうです。

RTX 5090で1枚あたり30秒かからないくらいで生成できるのでこれは主流になりそう。

本当に最近の中国のオープンソースAIはすごいです。

それにAIが進みすぎて今後、どうAIを見分けるべきなのか・・・・

クラウド版のAIは確かに透かしが最近はあったりと規制はありますがローカルは規制がほぼないのでやりたい放題です。

これがローカルでみんながやりたい理由でもありますがね・・・

最後にFluxで試しに作成した赤いハトをはっておきます。

一瞬みたらAIだとわからないレベルですよね・・・

OpenAIのgpt-oss-120bがギリギリ動いた(速度テストだけ)

· 約2分
もみじーな
個人開発者

LM Studioでgpt-oss-120bがギリギリ動作したので報告です。

私の環境

項目詳細(製品名や型番など)
CPUUltra7 265K
GPURTX 5090
Memory64GB (DDR5-4800)

MoEっぽいので動くとは思いましたがまぁ使えなくはない速度でした。

一応,トークン速度(14.55token/s)でした。

長いコードを書かせてみましたが使えなくはないくらいの生成速度ですが他の30bなどのモデル速度と比較するとやっぱり生成時間が苦痛です。

文章生成だけならいいかもしれないですがコード生成だったり修正だと待ち時間がいやなので少なくとも80GB以上のメモリがグラボにあるならいいですがないならおとなしく30bかAPI使ったほうがでいいす。

モデルのロードも60GBを超えるのでメモリ帯域速度的にかなり遅かったです。

使えそうならメモリ増設しようかなと思ったけど今回はいいかな
(2枚刺しにしている理由はDDR5は4枚だと不安定になると聞いたから)

OpenAIのgpt-oss-20bをテストする

· 約4分
もみじーな
個人開発者

LMStudioでgpt-oss-20bを試してみました。

20bなのであまり期待はできませんがQwen3 Coderと比較したかったので前と同じプロンプトでテストです。

HTML, CSS, JSを使用して、2025年9月に開催される『Tech Innovation Summit』のウェブサイトを作成してください。イベント概要、スケジュール、講演者紹介、チケット購入ページを含み、モダンで革新的なデザインにし、カウントダウンタイマーも実装してください。

gpt-oss-20bで作成したサイトが以下です。

https://momijiina.com/other/20250811/gpt-oss-20b.html


前回のqwen3-coder-30bでテストしたやつ

https://momijiina.com/other/20250801.html


正直、どっちも悪くはないですがqwen3-coder-30bのほうがきれいです。

gpt-oss-20bはRTX 5090で165.66 tok/secでした。

おそらくこちらもMOEです。

あと試してみてなかったのでqwen3-30b-a3b-2507も試してみました。

https://momijiina.com/other/20250811/qwen3-30b-a3b-2507.html

あれ? qwen3-30b-a3b-2507のほうがいい?

やっぱりテストプロンプトはもっと難しいやつにしたほうがいいかな?

なので次のテスト(プロンプトはAI生成です)

「Googleスプレッドシート風」の軽量ウェブアプリ(静的: HTML/CSS/Vanilla JSのみ)を生成してください。
要件:
index.html / styles.css / script.js の3ファイル構成
機能:
任意サイズ初期グリッド (例: 20列 x 30行) を生成
A1 形式セル参照
数式: 先頭= のセルは式として評価
四則演算 (+ - * /)
括弧 ()
セル参照 (例: =A1+B2*2)
範囲対応関数: SUM(A1:B5), AVG, MIN, MAX
再計算はセル変更時に全体再評価(循環参照はエラーマーク)
行/列の追加ボタン
選択セル強調・行列ヘッダー固定
コピー & ペースト (Ctrl+C / Ctrl+V) : 値ベース
Undo / Redo(直近履歴 50 件)
データの JSON / CSV エクスポート & インポート
ローカルストレージ自動保存(間隔 2 秒 or デバウンス)
ダーク / ライトテーマ切替
UI:
簡易ツールバー: 追加行/列, Undo, Redo, Export JSON, Import JSON, Export CSV, Theme toggle, Clear
ステータスバーに: 選択セルアドレス, 計算結果プレビュー
コード品質:
モジュール的構造 (関数を整理)
コメントで主要ロジック説明
依存なし(CDN含む)
アクセシビリティ配慮 (tabindex, aria-label)
セキュリティ:
eval 不使用。自作の式パーサー/トークナイザで実装
想定外トークンはエラー扱い
パフォーマンス:
1000+ セルでも即時レスポンス
再計算アルゴリズムはシンプルな全再計算で可(要最適化コメント)
出力: ファイルごとにコードブロック (ファイル名付き) で提示。
最後に利用手順 (ブラウザで開くだけ) と拡張アイデア箇条書き。

各モデルで作成したサイトの画像です。
ちょっと今回、JSONのインポートがあるので写真だけです。(危ないので)
ChatGPT5 比較用

gemma3 27b (53.93 tok/sec)

qwen3-coder-30b (128.50 tok/sec)

qwen3-30b-a3b-2507 (138.83 tok/sec)

gpt-oss-20b (164.46 tok/sec)

gemma3は見た目だけで入力が不可能でした。

gpt-oss-20b、qwen3-30b-a3b-2507に関してはセルは表示されず。

今回、1回の生成だけでまともに動いたローカルモデルはqwen3-coder-30bだけですがエラーを追加で貼り付ければ修正はどのモデルでも可能です。

GPT5を10点とするとqwen3-coder-30bは5か6点です。

ですがローカルで動くことに価値がありますのでqwen3-coder-30bは今のところ 5090で動作する最高のモデルですね。

UGREEN HDMI KVMを購入

· 約2分
もみじーな
個人開発者

Radeon RX 6950 XTも比較したいなと思ったときにわざわざマウスとHDMIケーブルを差し替えるのがめんどくさかったのでKVMを購入してみました。

サーバー用が少し高かったイメージがあったのでいくらかなと思ったのですが3500円でUGREENさんがうってました。

USB3.0と2.0で価格も500円くらいしか差がなかったですが3.0だと電源アダプターが必要みたいだったのでやめました。

中身はこんな感じです。

付属のHDMIは短いですがモニターの近くに置くものなので問題ないのともともとのHDMI 2つをこっちにさす感じです。

USB Type Bのほうはある程度長いのでメインとサブを1.5mくらい? 離してますが中央にKVMおけば問題なく届きました。

2か月で壊れたというレビューもあるので怖いですがとりあえず今は異常はなさそうです。

UGREENは安かろう悪かろうみたいなイメージが昔はありましたが最近はよく聞くので良くなったと信じます。

これですぐ壊れるなら次はAnkerを買います・・・

少し前に買ったUGREENの原神エディションはまだ壊れてないのも今回、品質を信じてみた決めてですかね。


一応 Amazonの製品名(型番とか書いてくれ・・・)
UGREEN HDMI KVM切替器 2入力1出力 キーボード、マウス、モニターを共有 PC2台用 4K@60Hz USB2.0 4ポート 切替器 HDMI2.0専用 ドライバー不要 簡単接続 手元スイッチ&USBケーブル付

Qwen3-Coder-30bで作成したアルバムの修正版

· 約1分
もみじーな
個人開発者

昨日、LM StudioとQwen3-Coder-30bで作成したものを修正しました。

アップロード後,1ページ目が挿入されていないバグを確認しましたが別にプログラムをGithubに保存するとかもないので修正はしないです。

無理やり表示されるようにしたので新しいページを確認してください。

https://momijiina.com/other/20250803

今回の修正内容は画像の周りに枠ができる問題の修正と裏表紙を作成しました。

とりあえずここまでできれば満足なのでまた別のものをつくります。

あと黒猫かわいいです。 

ホームとアイコンがドキュザウルスのデフォルトのままなので黒猫に変えようかな?

変わってたらそういうことです

Qwen3-Coder-30bでどこまでできるかテスト

· 約2分
もみじーな
個人開発者

LM StudioとQwen3-Coder-30bでどこまでコードが作れるのかテストしてみました。

特にやりたいお題もなかったのでたまたま聞いていたWONさんのSisterという曲のPVのアルバム風のものが作れるかテストしてみました。

「完璧すぎて可愛げがないと婚約破棄された聖女は隣国に売られる」というアニメのEDです。(ぜひ見てくださいw)

一応,Youtubeの動画はこちらです

この前、アマプラで何となく見てていい曲だなとYoutubeで聞いてました。

ってことで簡単に作成してみたアルバムが以下です。

https://momijiina.com/other/20250802/

画像は生成しましたがまぁ、それっぽいのが画像生成含めて60分くらいなのでかなりいいのではないですか?

調整すれば完璧なものも作れなくはないですがテストなので今回はここでやめます。

タイトルや写真のURLはいじってますので95%はAIコーディングです。

現状はプログラムがわかる人の補助ですが2,3年後はプログラマーなくなりそうで怖いですね。