
MoshiVis:实时语音对话和图像理解的开源模型
综合介绍 MoshiVis 是 Kyutai Labs 开发的一个开源项目,托管在 GitHub 上。它基于 Moshi 语音-文本模型(7B 参数),新增了约 2.06 亿个适配参数和冻结的 PaliGemma2 视觉编码器(400M 参数),让模型能实时用语...
综合介绍 MoshiVis 是 Kyutai Labs 开发的一个开源项目,托管在 GitHub 上。它基于 Moshi 语音-文本模型(7B 参数),新增了约 2.06 亿个适配参数和冻结的 PaliGemma2 视觉编码器(400M 参数),让模型能实时用语...
综合介绍 MiniMind 是一个开源项目,由开发者 jingyaogong 创建。它的核心目标是让普通人也能快速训练自己的 AI 模型。MiniMind 主打特点是用 2 小时在单张 NVIDIA 3090 显卡上从零训练一个 26M 参数的 GPT 模型...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 WritingBench 是 X-PLUG 团队开发的一个开源项目,托管在 GitHub 上。它是一个专门用来测试大模型写作能力的工具,提供了 1239 个真实世界的写作任务。这些任务覆盖 6 个主要领域和 100 个细分领域,结...
综合介绍 Free-Search 是一个由 Hanzla Javaid 开发的开源 API 工具,托管在 GitHub 上。它的主要功能是通过自定义搜索引擎提供实时的谷歌搜索结果,并爬取网页内容返回结构化数据。这个工具专为 AI 代理和大型语...
综合介绍 AI-ClothingTryOn 是一个基于 Python 的开源桌面应用程序,由开发者 speedTD 创建,托管在 GitHub 上。它利用 Google Gemini 人工智能技术,让用户上传人物照片和衣服图片,生成虚拟试穿效果。用户可以...
综合介绍 OpenDeepSearch 是一个开源的搜索工具,由 sentient-agi 团队开发。它结合了大型语言模型(LLM)和智能推理代理,让用户可以用简单的方式搜索网页信息并获取准确答案。这个工具的目标是让搜索变得更开放...
综合介绍 Vibe Draw 是一个开源项目,它由 Martin Sit 开发,能让用户把手绘草图变成漂亮的 3D 模型。这个工具的目标很简单:让任何人都能轻松做 3D 建模,不需要高超的艺术技巧或复杂的软件。它用人工智能技术,...
综合介绍 OAK(Open Agent Kit)是一个开源工具,帮助开发者快速搭建、自定义和部署AI智能体。它能连接任何大语言模型(LLM),比如OpenAI、Google或Anthropic的模型,还支持通过插件增加功能。OAK的设计目标很明...
综合介绍 LangGraph CUA 是由 LangChain 团队开发的一个开源项目。它基于 LangGraph 框架,让开发者可以用 Python 打造能直接操作电脑的 AI 智能体。这个工具的核心是“Computer Use Agent”(CUA),可以模拟人类...
综合介绍 n8n-mcp-server 是一个开源项目,托管在 GitHub 上,由 Leonard Sellem 开发。它是一个 MCP(Model Context Protocol)服务工具,专门用来与 n8n 工作流交互。n8n 是一个自动化工作流平台,而这个工具通...
综合介绍 Flowgram.ai 是由 ByteDance 开发的一款开源流程搭建引擎。它基于节点编辑,帮助开发者快速创建工作流程,支持固定布局和自由连线两种模式。项目使用 TypeScript 编写,代码托管在 GitHub 上,开源免费...
综合介绍 Cursor Auto Register 是一个开源项目,托管在 GitHub 上。它由开发者 ddCat-main 创建,旨在帮助用户自动注册和管理 Cursor AI 代码编辑器的账号。Cursor 是一款人工智能代码编辑工具,但免费试用账号...
综合介绍 Qwen2.5-Omni 是阿里巴巴云 Qwen 团队开发的一款开源多模态 AI 模型。它能处理文本、图像、音频和视频等多种输入,并实时生成文本或自然语音响应。这款模型于 2025 年 3 月 26 日发布,代码和模型文件托...
综合介绍 IndexTTS 是一个开源的文本转语音(TTS)工具,托管在 GitHub 上,由 index-tts 团队开发。它基于 XTTS 和 Tortoise 技术,通过改进模块设计,提供高效且高质量的语音合成。IndexTTS 使用了数万小时的数...
综合介绍 Dify-Plus是基于Dify开源项目二次开发的AI应用开发平台。它在Dify的基础上,新增了基于的管理中心,针对企业场景进行了功能优化。项目最初为企业内部使用,后来发现社区有类似需求,便开源分享。Dify-Pl...
综合介绍 Rankify 是由奥地利因斯布鲁克大学数据科学小组开发的开源 Python 工具包。它专注于信息检索、重排序和检索增强生成(RAG),提供了一个统一的框架。工具包内置 40 个预检索基准数据集,支持 7 种检索技...
综合介绍 CFG-Zero-star 是一个开源项目,由 Weichen Fan 和南洋理工大学 S-Lab 团队开发。它专注于改进流匹配模型中的分类器自由引导(CFG)技术,通过优化引导策略和零初始化方法,提升图像和视频生成的质量。...
综合介绍 Bonsai 是 deepgrove-ai 开发的一个开源语言模型,参数规模为 5 亿,采用三值权重(ternary weights)技术。它基于 Llama 架构和 Mistral 分词器设计,线性层经过调整以支持三值权重。模型主要使用 DCLM...
综合介绍 Motia 是一个面向软件工程师的开源 AI 代理框架,托管在 GitHub 上,由 MotiaDev 团队开发。它让开发者能用熟悉的编程语言(如 Python、TypeScript、Ruby)快速编写、测试和部署智能代理。Motia 的核心...