
VoiceCraft:开源零样本语音克隆与文本转语音工具
综合介绍 VoiceCraft是一个开源的语音编辑和零样本语音合成工具,基于神经编解码器语言模型。它采用了创新的编码序列生成方法,能够在已有语音序列上进行插入、删除和替换操作,生成自然、连贯的编辑语音。同时,...
综合介绍 VoiceCraft是一个开源的语音编辑和零样本语音合成工具,基于神经编解码器语言模型。它采用了创新的编码序列生成方法,能够在已有语音序列上进行插入、删除和替换操作,生成自然、连贯的编辑语音。同时,...
综合介绍 edge-tts是一个开源的Python模块,允许用户在Python代码中使用微软Edge的在线文本转语音服务,而无需Microsoft Edge浏览器、Windows操作系统或API密钥。提供了命令行下直接使用的edge-tts和edge-...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 CoAI.Dev (原 Chat Nio) 是一个集成多种AI模型的聊天平台,支持分布式流式传输、图像生成、跨设备对话同步及分享等功能。它实现了订阅和Token计费系统,Key中转服务以及多模型支持,还包括联网搜索和AI...
综合介绍 ChatOllama是一个基于大型语言模型(LLM)的开源在线聊天应用项目,支持众多语言模型和知识库管理。用户可以通过该平台进行模型管理(列表展示、下载、删除)、与模型聊天等功能。项目运用了Nuxt 3框架...
综合介绍 MinerU是由上海人工智能实验室OpenDataLab团队开发的一款开源数据提取工具,专注于从复杂的PDF文档、网页和电子书中高效提取内容。它能够将包含图片、公式、表格等元素的多模态PDF文档转化为易于分析的M...
综合介绍 DCT-Net 是一个由 DAMO 学院和北京大学王选计算机技术研究所共同开发的开源项目,旨在实现图像的动漫风格化转换。该项目利用深度学习技术,通过域校准翻译(Domain-Calibrated Translation)的方法,将...
综合介绍 Diffusers Image Outpaint 是由 Hugging Face 社区成员 fffiloni 创建的一个强大的 AI 图像扩展工具。该工具利用先进的扩散模型技术,可以将图像进行无缝扩展(图像的边缘部分进行外绘),生成高质量的图...
综合介绍 Tap4 AI WebUI 是一个开源的轻量级AI工具导航网站项目,旨在帮助用户轻松搭建自己的AI工具目录。该项目采用了Next.js和Supabase技术栈,支持多语言SEO优化,提供AI工具的分类筛选、搜索和详细展示功能,...
CodeFormer 综合介绍 CodeFormer 是一个面向鲁棒盲脸修复的代码库,由南洋理工大学 S-Lab 的研究团队开发,并在 NeurIPS 2022 上发表。该项目利用代码本查找变换器(Codebook Lookup Transformer)技术,旨在提升...
综合介绍 GFPGAN(Generative Facial Prior GAN)是由腾讯ARC(Applied Research Center)开发的一种开源人脸修复算法。该算法利用预训练的面部GAN(如StyleGAN2)中封装的丰富和多样的先验因素,进行盲脸修复。G...
综合介绍 Curiosity 是一个旨在探索和实验的项目,主要使用 LangGraph 和 FastHTML 技术栈,目标是构建一个类似 Perplexity AI 的搜索产品。项目的核心是一个简单的 ReAct Agent,利用 Tavily 搜索来增强文本生成...
综合介绍 Moshi Chat 是由法国非营利性AI实验室 Kyutai 推出的一款端到端实时AI语音助手。它不仅可以实时收听,还能进行自然对话,支持多模态交互,包括看、听、说的能力。Moshi Chat 能够理解用户的语调,可以在...
QAnything 综合介绍 QAnything(Question and Answer based on Anything)是由网易推出的本地知识库问答系统,支持各类文件格式及数据库,可离线安装使用。它可以处理PDF、Word、PPT、XLS等多种格式的文件,支持跨...
综合介绍 stickerbaker是一个开源的贴纸制作工具,利用人工智能技术来制作各种有趣的贴纸。无论是想要一个简单的猫咪贴纸还是想要制作一系列多样化的贴纸,stickerbaker都能满足你的需求。只需简单描述你想要的贴...
综合介绍 ALog 是一个基于人工智能的语音日记应用,旨在帮助用户通过语音记录日常生活。该项目由 duxins 开发,并在 GitHub 上开源。用户可以通过语音输入记录日记,应用会自动将语音转换为文字,并进行智能分析...
综合介绍 OpenSPG是由蚂蚁集团与OpenKG合作开发的开源知识图谱引擎,基于SPG(语义增强可编程图)框架。该引擎旨在提供显式语义表示、逻辑规则定义和操作框架等功能,支持领域知识图谱的构建和管理。OpenSPG结合...
综合介绍 Mem0(发音为“mem-zero”)是一个为AI助手和代理提供智能记忆层的开源项目。它能够记住用户偏好,适应个体需求,并随着时间的推移不断改进,使其成为客户支持聊天机器人、AI助手和自主系统的理想选择。Me...
综合介绍 Void是一个开源的Cursor替代品,基于vscode仓库的分支。它提供了一个强大的开发环境,旨在为开发者提供更高效的编码体验。Void的目标是通过社区贡献和快速迭代,不断提升其功能和稳定性。用户可以通过Gi...
综合介绍 GaiaNet-AI/gaianet-node是一个开源项目,允许用户在Mac、Linux或Windows WSL上通过一条命令快速安装默认的节点软件栈。用户可以初始化节点,自定义配置,下载模型文件和向量数据库文件,进而启动AI代理...