
Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物
综合介绍 Audiblez 是一个开源项目,旨在将电子书(如 .epub 格式)转换为有声书(如 .m4b 格式)。该项目利用 Kokoro 的高质量语音合成技术,支持多种语言和多种声音。用户只需简单的命令行操作,即可将电子书转...
综合介绍 Audiblez 是一个开源项目,旨在将电子书(如 .epub 格式)转换为有声书(如 .m4b 格式)。该项目利用 Kokoro 的高质量语音合成技术,支持多种语言和多种声音。用户只需简单的命令行操作,即可将电子书转...
综合介绍 Search-o1 是一个开源项目,旨在通过整合高级搜索机制来增强大规模推理模型(LRMs)的性能。其核心思想是通过动态的搜索和知识整合来解决推理过程中遇到的知识缺失问题。该项目由 sunnynexus 团队开发,...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 Transformers.js 是 Hugging Face 提供的一个 JavaScript 库,旨在将最先进的机器学习模型直接在浏览器中运行,无需服务器支持。该库与 Hugging Face 的 Python 版 transformers 库功能相当,支持多种预...
综合介绍 MoneyPrinter V2 是由FujiwaraChoki开发的一个开源项目,旨在通过自动化手段帮助用户在线赚钱。该项目主要集成了Twitter自动化、YouTube短视频生成以及联盟营销等功能。用户可以利用Python脚本进行内容...
综合介绍 RTranslator 是一款几乎开源的免费离线实时翻译应用,专为 Android 设备设计。用户可以通过连接蓝牙耳机,将手机放在口袋中,与他人进行如同对方说自己语言的对话。RTranslator 支持多种模式,包括对话...
综合介绍 Gemini Next Chat 是一个开源项目,旨在帮助用户轻松部署私人Gemini应用。该项目支持Gemini 1.5和Gemini 2.0多模态模型,用户可以通过一键部署在Vercel上免费使用。Gemini Next Chat 提供了跨平台客户端...
综合介绍 AutoMouser 是一个 Chrome 扩展程序,能够智能地跟踪用户交互,并使用 OpenAI 的 GPT 模型自动生成 Selenium 测试代码。它通过记录用户的浏览器操作并将其转换为稳健、可维护的 Python Selenium 脚本,...
综合介绍 Vanna是一个MIT许可的开源Python框架,专注于通过RAG(检索增强生成)技术生成SQL查询。用户可以通过训练RAG模型,将其应用于自己的数据,然后提出问题,Vanna会返回相应的SQL查询。这些查询可以自动在...
综合介绍 SVFR(Stable Video Face Restoration)是一个用于视频人脸修复的统一框架,支持基础人脸修复(BFR)、着色、修复及其组合任务。该框架利用生成和运动先验,通过统一的面部修复框架整合任务特定信息,提...
综合介绍 LiveTalking是一个开源的实时互动数字人系统,致力于构建高质量的数字人直播解决方案。该项目采用Apache 2.0开源协议,集成了多项前沿技术,包括ER-NeRF渲染、实时音视频流处理、唇形同步等。系统支持实...
综合介绍 Aider是一款强大的开源AI编程助手工具,它能够通过自然语言对话的方式帮助开发者编写、编辑和重构代码。作为一款交互式的AI配对编程工具,Aider支持多种主流编程语言,可以无缝集成到Git工作流中,并能...
综合介绍 JoyGen是一个创新的两阶段说话人脸视频生成框架,专注于解决音频驱动的面部表情生成问题。该项目由京东科技团队开发,采用先进的3D重建技术和音频特征提取方法,能够准确捕捉说话人的身份特征和表情系数...
综合介绍 视频字幕去除工具(Video-subtitle-remover,简称VSR)是一款基于AI技术的视频处理软件,专门用于去除视频中的硬字幕和文本水印。该工具采用了多种AI算法模型(STTN、LAMA、PROPAINTER),能够智能识别...
综合介绍 TimesFM 2.0 - 500M PyTorch 是由 Google Research 开发的预训练时间序列基础模型,专为时间序列预测而设计。该模型能够处理长达 2048 个时间点的上下文长度,并支持任意的预测范围。TimesFM 2.0 在多个...
综合介绍 微信视频号下载器是一个开源项目,旨在帮助用户快速下载微信视频号中的视频内容。该工具支持多种视频格式和平台,用户可以方便地在Windows和macOS系统上使用。项目由ltaoo开发,并托管在GitHub上,用户...
综合介绍 Riona-AI-Agent是一个创新的AI驱动自动化工具,专门设计用于管理和优化各大社交媒体平台的运营。该项目利用先进的AI模型,为Instagram、Twitter和GitHub等平台提供智能化的内容生成和账户管理功能。系统...
综合介绍 NV Ingest(NVIDIA Ingest) 是一套早期访问的微服务,专为解析数十万复杂、混乱的非结构化 PDF 和其他企业文档而设计。它能够将这些文档转换为元数据和文本,以便嵌入到检索系统中。NVIDIA Ingest 支持...
综合介绍 Always-On AI Assistant是一个创新的AI助手项目,它通过整合Deepseek-V3、RealtimeSTT和Typer等先进技术,打造了一个功能强大的永久在线AI助理系统。该项目特别针对工程开发场景进行优化,提供了完整的...
综合介绍 STAR (Spatial-Temporal Augmentation with Text-to-Video Models) 是由南京大学、字节跳动和西南大学联合开发的创新型视频超分辨率框架。该项目致力于解决真实世界视频超分辨率处理中的关键问题,通过...