メインコンテンツまでスキップ

「Wan2.2」タグの記事が2件件あります

全てのタグを見る

Qwen-Image-Editを使った動画のフレーム置き換え

· 約2分
もみじーな
個人開発者

Wan2.2 Animateだとアニメベースの動画だったりだと置き換えが不安定なのでテストしてみました。

やり方

怒られそうなのでだいぶ簡単に書きます。
一応、自動化してますが1フレームごとにOpenCVで切り取りながら同じ画像じゃないかだけ判定してQwen-Image-Editに飛ばしてry
さらにキャラを固定させるためにプロンプトをある程度細かく長くつくりLoraも強めに当ててます。

テスト動画1(初回テスト)

Youtubeの【未確認で進行形】というアニメOPを360Pで5秒くらいだけ切り取り生成した動画です。

怒られそうなので動画は調べてください。

2期まだか?

ステップ数4で各フレーム生成してます。

このテストの失敗点は360Pで切り取ったという解像度の低さとフレーム取得の不安定とLoraとプロンプト,ステップ数,etc(きりがないですね)

テスト動画2(微調整テスト)

みんな大好きLonely Lonelyのトレース + Lora適用です。

だいぶよくなったのではないかと思いますがフレーム数,解像度,ステップ数,書き出しがバグって解像度がおかしくなった,etc・・・

ステップ数8で各フレーム生成してます。

まぁ、だいぶいいですが私のテストはここで終わります。

結論

やろうと思えばアニメのトレースがいけそう

そして色んな所から怒られそう。

ここでやめておきます。

Wan2.2をRTX5090で試してみる

· 約3分
もみじーな
個人開発者

Wan2.2がでてから放置してましたがWan2.2のAnimeteを5090で試す為に今回,色々ダウンロードしたのでその内容です。
Wan2.2 Animeteは360Pだと粗すぎるし720Pだと結構時間かかる割に微妙だったのでやめました。

Wan2.2 14B T2V テキストtoビデオワークフローを使ってます。
設定しないと場合によってページング ファイルが小さすぎるとかいうエラーがでますがまぁ動くようになりました。

使い方とワークフロー

使い方について公式wikiと公式ワークフロー使ってますのでそちらを確認してください。
公式Wiki

RTX5090での生成時間とか

裏でゲームとか動いてたので正確ではないですが640x640で50-70秒です
720Pで3分かからないくらいです。

プロンプトも一応,日本語対応してるんですね 生成時間とか参考図

生成してみた動画とか

上の画像で生成したのがこんな感じの動画です。(ローカルで作ったと思えば凄いです)
元画像はQwenImageで生成してます。(崩壊3rdのヴィタちゃんと初音ミクです)

一応,初期設定での640x640です

次のバージョンへの期待とComfyCloud(A100 40GBらしい)

Wan2.2はローカルとしてはかなりいいです。

2.5はプレビューでてますがローカル用に公開されるのか?
そもそも5090程度で動作するのか?

今回,Comfyから公式に出たクラウドサービスのComfyCloudもベータ初期にAnimeteを何となく試してましたがWanを使うなら5090より速い場合(要検証)が多かったのでサブスクを検討してますが支払方法がStripeかlinkしかないので迷ってます。

どっちも使ったことがないのでクレジットカード入力は怖いです。

ただ月20ドルで1日,8時間も動かせる?らしいので画像生成サービスとしては最強じゃないですかね。

問題はまだモデルがプリインストールのみらしいです。(Loraもまだダメそう)

Comfy Cloudの価格詳細