
F5-TTS:少样本语音克隆,生成流畅且感情丰富的克隆声音
综合介绍 F5-TTS 是一种新型非自回归文本到语音(TTS)系统,基于流匹配的扩散变换器(Diffusion Transformer, DiT)。该系统通过使用 ConvNeXt 模型来优化文本表示,使其更容易与语音对齐,从而显著提升了合成质...
综合介绍 F5-TTS 是一种新型非自回归文本到语音(TTS)系统,基于流匹配的扩散变换器(Diffusion Transformer, DiT)。该系统通过使用 ConvNeXt 模型来优化文本表示,使其更容易与语音对齐,从而显著提升了合成质...
综合介绍 eSearch 是一款由 xushengfeng 开发的开源跨平台截图工具,支持 Windows、macOS 和 Linux 系统。它集成了多种功能,包括截图、OCR 识别、搜索、翻译、贴图、以图搜图和录屏等。eSearch 采用 Electron 框...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 PostNitro 是一款基于人工智能的轮播图生成器,专为提升社交媒体参与度而设计。用户只需输入主题或描述,PostNitro AI 即可在几分钟内生成定制的轮播图,适用于 Instagram、LinkedIn、TikTok 等平台。该...
综合介绍 AsrTools是一款智能语音转文字工具,内置剪映、快手、必剪等大厂接口,无需GPU或繁琐配置,支持高效的多线程批处理。它基于PyQt5开发,界面美观且用户友好,能够输出SRT和TXT格式字幕文件。该工具通过调...
综合介绍 Surya是一个开源的多语言文档OCR工具包,支持90多种语言的文本识别。它不仅能够进行逐行文本检测,还能进行布局分析、阅读顺序检测和表格识别。Surya的性能与云服务相媲美,适用于各种类型的文档,包括P...
因国内部署无法访问hugging face,所以在大佬部署方案的基础上改造成能部署到cloudflare workers。 准备工作 1、注册 cloudflare 2、注册hugging face并申请api key,申请api key地址 3、复制以下代码部署...
综合介绍 Inbox Zero 是一个开源的邮件管理应用,旨在通过 AI 助手帮助用户快速实现收件箱零邮件。该应用提供了多种功能,包括自动回复、归档、标签和转发邮件,管理和退订新闻通讯,阻止冷邮件,跟踪邮件活动等...
综合介绍 小猿口算逆向笔记是一个开源项目,旨在记录和分享对小猿口算应用进行逆向工程的过程和方法。该项目包含了多种逆向工具和技术的使用说明,如Frida、dexdump等,帮助用户了解和破解小猿口算的加密算法和数...
综合介绍 小猿口算自动答题工具是一个基于Python的开源项目,旨在通过OCR识别和自动化脚本来高效解决小猿口算应用中的题目。该工具利用了OpenCV和Tesseract等技术,能够实时识别屏幕上的题目并自动填写答案,极大...
综合介绍 GPT-Telegram-Worker 是一个基于 Cloudflare Workers 的多模型 AI Telegram 机器人,支持 OpenAI、Claude、Azure 等多个 API。该项目采用 TypeScript 开发,模块化设计便于扩展,提供快速、可扩展的服务...
综合介绍 Cloud Document Converter 是一个 Chrome 扩展,专为将飞书云文档转换为 Markdown 格式而设计。用户可以通过该工具轻松下载或复制飞书云文档为 Markdown 文件,方便进行二次编辑和分享。该工具支持多种 ...
综合介绍 CogniWerk 是一个基于浏览器的图像创意生成平台,旨在为专业人士提供先进的生成式AI图像模型。该平台通过用户友好的界面,帮助用户轻松创建文本、图像和视频内容。CogniWerk 的核心功能包括文本转图像、...
综合介绍 BatchTool 是一款免费的在线 AI 批量背景去除工具,支持 JPG、PNG、WebP 等主流图片格式。它无需登录,所有处理均在本地完成,确保隐私安全。通过 WebGPU 加速,BatchTool 提供快速高效的图片处理体验,...
综合介绍 Image AI 是一个卓越的一体化 AI 图片平台,提供多种先进的图片工具,帮助用户轻松实现高质量的视觉效果。无论是换脸、图片识别、文本生成图片,还是图片去背景,Image AI 都能满足您的需求。所有工具均...
综合介绍 Lenso.ai 是一个创新的人工智能平台,专为反向图像搜索设计。用户可以通过上传图像或选择示例图像,探索来自网络的数十亿张图像。该平台利用先进的AI技术,提供高度准确的搜索结果,包括地点、人物、重...
综合介绍 Snyk DeepCode AI 是一款由 Snyk 提供的先进代码安全工具,利用多种 AI 模型和安全特定数据,帮助开发者快速发现和修复代码中的安全漏洞。DeepCode AI 通过自动化的代码审查和修复功能,显著提升开发效...
综合介绍 QuickPiperAudiobook 是一个开源项目,旨在通过简单的一条命令,将各种文本格式(如 epub、mobi、txt、PDF、HTML 等)转换为自然音质的有声书。该工具使用 Piper 模型进行转换,并管理 Piper 的安装和相...
综合介绍 Crawl4AI 是一个开源的异步网页爬虫工具,专为大型语言模型(LLMs)和人工智能(AI)应用设计。它简化了网络爬虫和数据提取流程,支持高效的网页爬取,并提供对 LLM 友好的输出格式,如 JSON、清理过的 ...
综合介绍 Cloudflare Serverless Registry 是一个基于 Cloudflare Workers 和 R2 存储的无服务器容器注册表。它支持镜像的推送和拉取,并提供用户名密码和基于公钥的 JWT 认证。该项目易于部署,兼容 Docker 操作...