ConoHa VPSのL4でLora学習する
· 約3分
ConoHa VPSのL4でLora学習するためのメモです。
Google Colabとどっちがいいかと言われればどっちもメリットかデメリットあるので好きな方をColab Pro+の方が財布には優しいです。
Colab Proもバックグラウンド実行できるならよかったんですけどね。
長時間作業してると間違ってブラウザ閉じたり再起動されたりするのでバックグラウンド実行(最低Colab Pro+)はほしいです。
あと学習させる画像によってはBanされるリスクがあるのでね?
長いので開発の方に入れてもよかったですけど今回はblog側に
準備
アップデート
立てたばっかなので更新
sudo apt -y update && sudo apt -y upgrade
Nvidiaのドライバーインストール
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey |
sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
&& curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
ドライバーをインストール
sudo ubuntu-drivers autoinstall
再起動は必須
体感で5分くらいかかった気がする長い
sudo reboot
確認
sudo nvidia-smi

python3をインストールする
pythonはaptで十分です
sudo apt install python3.10-venv
sudo apt install python3-dev
ai-toolkitのインストール
基本公式通りに
エラーは特にでなかった
git clone https://github.com/ostris/ai-toolkit.git
cd ai-toolkit
python3 -m venv venv
source venv/bin/activate
pip3 install --no-cache-dir torch==2.7.0 torchvision==0.22.0 torchaudio==2.7.0 --index-url https://download.pytorch.org/whl/cu126
pip3 install -r requirements.txt
起動テストする
nodejsを使うのでインストール
aptでいれたら古かったですね
sudo apt -y install nodejs npm
sudo npm install n -g
sudo n lts

WebUI使うのでパスワードを設定しておく必要があります。
super_secure_passwordは公式初期パスワードなので長く使うなら変更してください。
cd ui
AI_TOOLKIT_AUTH=super_secure_password npm run build_and_start
ポート開放とか
どうせすぐ消すので直接
ConoHaはコントロールパネルからも許可が必要
sudo ufw allow 8675
ufw reload
Screenコマンドで一時的に動かす
screen
AI_TOOLKIT_AUTH=super_secure_password npm run build_and_start
起動後はCtrl+A+Dとかで抜けれます。
Lora学習を開始する
WebUIへアクセスする
初めてパスワード画面みたので新鮮です。

Z-Image-Turboを学習する
VRAM 24GBあるのでせっかくならZ-Image-Turboを学習する
ちょうど学習したいやつあったのでdatasetsフォルダに新しくフォルダ作ってRLoginから放り込みました。

設定はこれでいいかでやりました


とりあえず学習を開始してから6時間くらいで完了してたと思います。

私はローカルでいいかな。
