Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装
综合介绍 Voice-Pro 是一个基于 Gradio WebUI 的多功能工具,支持语音转文字、文本转语音、实时翻译、YouTube 视频下载和人声分离。它集成了 Whisper、Faster-Whisper 和 Whisper-Timestamped 等技术,提供高效的...
综合介绍 Voice-Pro 是一个基于 Gradio WebUI 的多功能工具,支持语音转文字、文本转语音、实时翻译、YouTube 视频下载和人声分离。它集成了 Whisper、Faster-Whisper 和 Whisper-Timestamped 等技术,提供高效的...
综合介绍 Zamzar 是一个功能强大的在线文件转换工具,支持超过 1200 种文件格式的转换。无论是文档、图片、视频、音频还是电子书,Zamzar 都能快速高效地完成转换任务。用户无需下载任何软件,只需在网页上选择文...
GizAI 是一个集成了AI生成、笔记和云存储功能的一站式平台。用户可以通过GizAI生成图像、视频、音频、文本、角色、故事和游戏,并且可以在平台上进行协作笔记和云存储。GizAI 提供了多种AI工具,帮助用户提高生产力和创造力,同时保护用户隐私,不会在未经同意的情况下使用用户数据进行AI训练。 GizAI 由 Giz Inc. 运营,成立于 Stripe Atlas,并获得 Google for Startups Cloud、Microsoft for Startups Founders Hub、AWS Activate 和 Paddle AI LaunchPad 等项目的支持。GizAI 坚信 使用先进的 生成式AI技术 是每个人的权力,提供免费的广告支持计划,允许用户生成、协作和分享内容。
综合介绍 如果你在用 MacBook,试试 AI Hear:可以录音、实时本地语音转文字、并翻译、最终导出字幕。可以用它辅助你听跨国会议、英文有声书。 AI Hear是一款本地运行的软件,提供一键实时翻译和转录功能,支持多...
综合介绍 SoniTranslate 是一个强大且用户友好的视频多语言配音工具,旨在提供视频翻译和同步音频的解决方案。它利用先进的语音识别和机器翻译技术,将视频内容翻译成多种语言,并保持音频同步。该项目基于 Gradi...
综合介绍 FunASR是一个由阿里巴巴达摩院开发的开源语音识别工具包,旨在为学术研究和工业应用提供桥梁。它支持多种语音识别功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说...
综合介绍 AsrTools是一款智能语音转文字工具,内置剪映、快手、必剪等大厂接口,无需GPU或繁琐配置,支持高效的多线程批处理。它基于PyQt5开发,界面美观且用户友好,能够输出SRT和TXT格式字幕文件。该工具通过调...
Happy Scribe 综合介绍 Happy Scribe提供自动和人工的音频转写服务,以高准确率将音频转换为文字,并支持多种语言和格式。它包含互动式编辑器、协作工具、多种导出格式、机器翻译等功能。该平台安全可靠,...
综合介绍 Whisper是由Const-me开发的一个GitHub开源项目,专注于使用GPGPU实现OpenAI的Whisper自动语音识别(ASR)模型的高性能推断。这个项目是基于MPL-2.0许可证发布的,最新版本1.12发布于2023年7月22日。在代...
Buzz 综合介绍 Buzz是一个由chidiwilliams创建的开源项目,它能够在个人电脑上离线转录和翻译音频。该项目依托于OpenAI的Whisper技术,使得用户可以不依赖互联网连接进行音频文件的转写和翻译工作。通过GitHub,...
综合介绍 Deepgram是一家专注于语音识别和自然语言处理技术的公司,提供强大的语音到文本(Speech-to-Text)和文本到语音(Text-to-Speech)API。该平台利用先进的人工智能技术,帮助开发者将语音转录和理解功能...