メインコンテンツまでスキップ

ConoHa VPSのL4でLora学習する

· 約3分
もみじーな
個人開発者

ConoHa VPSのL4でLora学習するためのメモです。
Google Colabとどっちがいいかと言われればどっちもメリットかデメリットあるので好きな方をColab Pro+の方が財布には優しいです。
Colab Proもバックグラウンド実行できるならよかったんですけどね。
長時間作業してると間違ってブラウザ閉じたり再起動されたりするのでバックグラウンド実行(最低Colab Pro+)はほしいです。

あと学習させる画像によってはBanされるリスクがあるのでね?

長いので開発の方に入れてもよかったですけど今回はblog側に

準備

アップデート

立てたばっかなので更新

sudo apt -y update && sudo apt -y upgrade

Nvidiaのドライバーインストール

curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | 
sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
&& curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

ドライバーをインストール

sudo ubuntu-drivers autoinstall

再起動は必須

体感で5分くらいかかった気がする長い

sudo reboot

確認

sudo nvidia-smi

python3をインストールする

pythonはaptで十分です

sudo apt install python3.10-venv
sudo apt install python3-dev

ai-toolkitのインストール

基本公式通りに
エラーは特にでなかった

git clone https://github.com/ostris/ai-toolkit.git
cd ai-toolkit
python3 -m venv venv
source venv/bin/activate
pip3 install --no-cache-dir torch==2.7.0 torchvision==0.22.0 torchaudio==2.7.0 --index-url https://download.pytorch.org/whl/cu126
pip3 install -r requirements.txt

起動テストする

nodejsを使うのでインストール
aptでいれたら古かったですね

sudo apt -y install nodejs npm
sudo npm install n -g
sudo n lts

WebUI使うのでパスワードを設定しておく必要があります。
super_secure_passwordは公式初期パスワードなので長く使うなら変更してください。

cd ui
AI_TOOLKIT_AUTH=super_secure_password npm run build_and_start

ポート開放とか

どうせすぐ消すので直接
ConoHaはコントロールパネルからも許可が必要

sudo ufw allow 8675
ufw reload

Screenコマンドで一時的に動かす

screen
AI_TOOLKIT_AUTH=super_secure_password npm run build_and_start

起動後はCtrl+A+Dとかで抜けれます。

Lora学習を開始する

WebUIへアクセスする

初めてパスワード画面みたので新鮮です。

Z-Image-Turboを学習する

VRAM 24GBあるのでせっかくならZ-Image-Turboを学習する
ちょうど学習したいやつあったのでdatasetsフォルダに新しくフォルダ作ってRLoginから放り込みました。

設定はこれでいいかでやりました

とりあえず学習を開始してから6時間くらいで完了してたと思います。

私はローカルでいいかな。