综合介绍
Retrieval based Voice Conversion WebUI是一个基于VITS的简单易用的语音转换框架,可以实现任意说话人之间的语音转换,包括歌曲的翻唱和实时的变声。它具有低延迟、优秀的变声效果、少量数据训练等特点,支持N卡、A卡、I卡的加速,提供网页界面和实时变声界面,还可以调用UVR5模型来快速分离人声和伴奏,使用最先进的人声音高提取算法RMVPE来根绝哑音问题。
底模使用接近50小时的开源高质量VCTK训练集训练,无版权方面的顾虑,请大家放心使用
请期待RVCv3的底模,参数更大,数据更大,效果更好,基本持平的推理速度,需要训练数据量更少。
功能列表
- 训练自己的语音转换模型,只需10分钟的语音数据即可
- 使用预训练的语音转换模型,支持多种采样率和音色
- 使用网页界面或实时变声界面进行语音转换,支持端到端的低延迟
- 使用UVR5模型来分离人声和伴奏,支持多种格式的音频文件
- 使用RMVPE算法来提取人声音高,支持pytorch/onnx/DirectML
使用帮助
- 下载或克隆本仓库,安装所需的依赖和预模型
- 运行go-web.bat或go-realtime-gui.bat,选择想要执行的操作
- 根据界面提示,选择输入和输出的语音文件或设备,调整参数和选项
- 点击开始或停止,享受语音转换的乐趣