AI VoiceChanger(MMVCServerSIO)を5090で動かす

今回はアバターに関係ない技術記事です。

AI VoiceChanger(MMVCServerSIO)を5090(cu130)で動かしたメモです。

コンソールを利用するため、かなり上級者向けの記事となっております。

それでは続きをどうぞ

MMVCServerSIOは、デフォルトでは5090で動きません。

私は以下の手順で動作までこぎつけました。

前提

git
python3.11.9

winget install python.python.3.11

手順

1. githubからMMVCServerSIOをcloneする

git clone https://github.com/w-okada/voice-changer.git
cd voice-changer/server

2. pyenvを作成する

pythom -m venv vc

3. requirements.txtをメモ帳などで以下に置き換える

--extra-index-url https://download.pytorch.org/whl/cu130
uvicorn==0.34.2
pyOpenSSL==25.0.0
numpy==2.1.2
torch==2.9.1+cu130
torchaudio==2.9.1+cu130
resampy==0.4.3
python-socketio==5.13.0
fastapi==0.115.12
python-multipart==0.0.20
scipy==1.16.3
matplotlib==3.10.3
websockets==15.0.1
faiss-cpu==1.13.2
torchcrepe==0.0.23
librosa==0.11.0
gin==0.1.6
gin_config==0.5.0
einops==0.8.1
local_attention==1.11.1
sounddevice==0.5.1
dataclasses_json==0.6.7
onnxsim
torchfcpe==0.0.4
pyworld==0.3.5

4. requirementsをインストールする

python -m pip install -r requirements.txt

5. fairseqを別途インストールする

python -m pip install git+https://github.com/One-sixth/fairseq.git

6. onnxruntime-gpuを別途インストールする

python -m pip install --pre --index-url https://aiinfra.pkgs.visualstudio.com/PublicPackages/_packaging/ORT-Nightly/pypi/simple/ onnxruntime-gpu

7. CUDA Toolkit 12をインストールする

https://developer.nvidia.com/cuda-12-9-1-download-archive

8. MMVCServerSIOを起動する

./vc/Scripts/activate
python MMVCServerSIO.py -p 18888 --https true \
    --content_vec_500 pretrain/checkpoint_best_legacy_500.pt  \
    --content_vec_500_onnx pretrain/content_vec_500.onnx \
    --content_vec_500_onnx_on true \
    --hubert_base pretrain/hubert_base.pt \
    --hubert_base_jp pretrain/rinna_hubert_base_jp.pt \
    --hubert_soft pretrain/hubert/hubert-soft-0d54a1f4.pt \
    --nsf_hifigan pretrain/nsf_hifigan/model \
    --crepe_onnx_full pretrain/crepe_onnx_full.onnx \
    --crepe_onnx_tiny pretrain/crepe_onnx_tiny.onnx \
    --model_dir model_dir \
    --samples samples.json

PageTop