AI个人学习
和实操指南

SoniTranslate:开源视频翻译配音解决方案,多人配音、调整语速与模仿原声

综合介绍

SoniTranslate 是一个强大且用户友好的视频多语言配音工具,旨在提供视频翻译和同步音频的解决方案。它利用先进的语音识别和机器翻译技术,将视频内容翻译成多种语言,并保持音频同步。该项目基于 Gradio 库构建,提供了用户友好的 Web 界面,支持多种语言和多种输出格式,适用于内容创作者和需要多语言视频翻译的用户。

Colab 笔记本:https://colab.research.google.com/github/R3gm/SoniTranslate/blob/main/SoniTranslate_Colab.ipynb

SoniTranslate:高可用的开源一键视频翻译配音,支持多人配音、调整语速并模仿原声-1
在线演示:https://huggingface.co/spaces/r3gm/SoniTranslate_translate_audio_of_a_video_content

 

功能列表

  • 视频翻译:将视频内容翻译成多种语言。
  • 同步音频:保持翻译后的音频与视频同步。
  • 多语言支持:支持超过 80 种语言的翻译。
  • 字幕生成:自动生成翻译后的字幕文件。
  • 语音替换:使用 TTS 模型替换视频中的原始语音。
  • 用户友好界面:基于 Gradio 库构建的 Web 界面,操作简便。
  • 多种输出格式:支持 MP3、MP4、MKV、WAV 和 OGG 等多种格式的输出。

 

使用帮助

安装流程

  1. 准备环境:确保已安装 NVIDIA 驱动程序和 CUDA 11.8.0。
  2. 安装 FFmpeg:用于处理视频和音频文件。
  3. 安装 SoniTranslate
    • 克隆 GitHub 仓库:git clone https://github.com/R3gm/SoniTranslate.git
    • 进入项目目录:cd SoniTranslate
    • 创建并激活 Conda 环境:conda create -n sonitr python=3.8conda activate sonitr
    • 安装依赖:pip install -r requirements.txt
  4. 运行应用
    • 启动应用:python app_rvc.py
    • 打开浏览器访问本地 URL:http://127.0.0.1:7860

使用流程

  1. 上传视频:在 Web 界面中上传需要翻译的视频文件。
  2. 选择语言:选择目标翻译语言。
  3. 配置选项:根据需要配置字幕生成、语音替换等选项。
  4. 开始翻译:点击“开始翻译”按钮,等待翻译完成。
  5. 下载结果:翻译完成后,下载生成的翻译视频、音频或字幕文件。

详细操作步骤

  1. 上传视频:点击“上传视频”按钮,选择本地视频文件进行上传。
  2. 选择语言:在“目标语言”下拉菜单中选择需要翻译的语言。
  3. 配置选项
    • 字幕生成:勾选“生成字幕”选项,系统将自动生成翻译后的字幕文件。
    • 语音替换:勾选“语音替换”选项,系统将使用 TTS 模型替换视频中的原始语音。
  4. 开始翻译:点击“开始翻译”按钮,系统将开始处理视频并进行翻译。
  5. 查看进度:在“翻译进度”栏中查看当前翻译进度,等待翻译完成。
  6. 下载结果:翻译完成后,点击“下载”按钮,选择需要的输出格式(MP3、MP4、MKV、WAV 或 OGG),下载生成的文件。

AI轻松学

普通人的AI入门指南

帮助你以低成本、零基础学会如何利用AI工具。AI就像办公软件一样,是每个人的必备技能。 掌握AI会让你在求职中占据优势,在未来的工作和学习中事半功倍。

查看详情>
未经允许不得转载:首席AI分享圈 » SoniTranslate:开源视频翻译配音解决方案,多人配音、调整语速与模仿原声

首席AI分享圈

首席AI分享圈专注于人工智能学习,提供全面的AI学习内容、AI工具和实操指导。我们的目标是通过高质量的内容和实践经验分享,帮助用户掌握AI技术,一起挖掘AI的无限潜能。无论您是AI初学者还是资深专家,这里都是您获取知识、提升技能、实现创新的理想之地。

联系我们
zh_CN简体中文