AI个人学习
和实操指南

Retrieval based Voice Conversion WebUI:基于检索的语音转换框架|模拟真人歌声

综合介绍

Retrieval based Voice Conversion WebUI是一个基于VITS的简单易用的语音转换框架,可以实现任意说话人之间的语音转换,包括歌曲的翻唱和实时的变声。它具有低延迟、优秀的变声效果、少量数据训练等特点,支持N卡、A卡、I卡的加速,提供网页界面和实时变声界面,还可以调用UVR5模型来快速分离人声和伴奏,使用最先进的人声音高提取算法RMVPE来根绝哑音问题。

colab在线体验

底模使用接近50小时的开源高质量VCTK训练集训练,无版权方面的顾虑,请大家放心使用


请期待RVCv3的底模,参数更大,数据更大,效果更好,基本持平的推理速度,需要训练数据量更少。

 

-1

训练推理界面

 

-2

实时变声界面

 

 

功能列表

 

  • 训练自己的语音转换模型,只需10分钟的语音数据即可
  • 使用预训练的语音转换模型,支持多种采样率和音色
  • 使用网页界面或实时变声界面进行语音转换,支持端到端的低延迟
  • 使用UVR5模型来分离人声和伴奏,支持多种格式的音频文件
  • 使用RMVPE算法来提取人声音高,支持pytorch/onnx/DirectML

 

 

使用帮助

 

  • 下载或克隆本仓库,安装所需的依赖和预模型
  • 运行go-web.bat或go-realtime-gui.bat,选择想要执行的操作
  • 根据界面提示,选择输入和输出的语音文件或设备,调整参数和选项
  • 点击开始或停止,享受语音转换的乐趣
AI轻松学

普通人的AI入门指南

帮助你以低成本、零基础学会如何利用AI工具。AI就像办公软件一样,是每个人的必备技能。 掌握AI会让你在求职中占据优势,在未来的工作和学习中事半功倍。

查看详情>
未经允许不得转载:首席AI分享圈 » Retrieval based Voice Conversion WebUI:基于检索的语音转换框架|模拟真人歌声

首席AI分享圈

首席AI分享圈专注于人工智能学习,提供全面的AI学习内容、AI工具和实操指导。我们的目标是通过高质量的内容和实践经验分享,帮助用户掌握AI技术,一起挖掘AI的无限潜能。无论您是AI初学者还是资深专家,这里都是您获取知识、提升技能、实现创新的理想之地。

联系我们
zh_CN简体中文