🚀邀请体验：中国首家 AI IDE 智能编程软件 Trae 中文版下载，不限量使用 DeepSeek-R1 和 Doubao-pro!

共 1020 篇文章

标签：AI开源项目第38页

Genesis：开源生成式物理引擎，实现基于真实物理的4D动态世界模拟

综合介绍 Genesis 是一个为通用机器人和具身 AI 学习设计的生成性物理世界。它提供了一个统一的仿真平台，支持多种材料和物理现象的模拟。Genesis 旨在通过结合生成性 AI 和物理仿真，解锁无限多样的数据，帮助机...

2024-12-20AI工具 AI开源项目 AI文本与图片转3D

Kolors：生成高质量图像的文本到图像模型，支持生成中文海报

综合介绍 Kolors是由快手团队开发的大规模文本到图像生成模型，基于潜在扩散技术。该模型训练于数十亿对文本-图像数据对，能够生成高质量、复杂语义准确的图像，并支持中英文输入。Kolors在视觉质量、复杂语义准...

2024-12-20AI工具 AI开源项目 AI自部署图像生成工具

Trae中文版首发邀请下载：注册后不限量使用DeepSeek-R1！

开启 Builder 智能编程模式，无限量使用 DeepSeek-R1 和 DeepSeek-V3 ，对比海外版体验更加流畅。只需输入中文指令，不懂编程的小白也可以零门槛编写自己的应用。

2025-05-09

ColorFlow：漫画着色，黑白图像自动着色，提升图像色彩一致性和质量

综合介绍 ColorFlow是由腾讯ARC团队开发的图像序列自动着色工具，旨在解决黑白图像序列的自动着色问题。该工具利用检索增强的着色管道，通过参考图像池准确生成各种元素的颜色，包括角色的头发颜色和服装，确保颜...

2024-12-19AI工具 AI图像风格控制 AI开源项目

BrushEdit：腾讯ARC发布的图像修复和编辑的全能工具

综合介绍 BrushEdit 是由腾讯ARC实验室开发的一款全能图像修复和编辑工具。该工具基于最新的AI技术，能够自动识别和修复图像中的缺陷，同时支持用户进行交互式编辑。BrushEdit 结合了多种先进的图像处理算法，提...

2024-12-19AI工具 AI图像编辑 AI开源项目

Outlines：通过正则表达式、JSON或Pydantic模型生成结构化文本输出

综合介绍 Outlines 是一个由 dottxt-ai 开发的开源库，旨在通过结构化文本生成来提升大语言模型（LLM）的应用能力。该库支持多种模型集成，包括 OpenAI、transformers、llama.cpp 等，提供简单而强大的提示原语，...

2024-12-19AI工具 AI开源项目文档提取与清洗

RapBank：根据歌词和伴奏直接生成说唱(Rap)人声的模型（目前开放了数据集）

综合介绍 RapBank 是一个专为说唱歌词生成而设计的数据集和工具集。该项目由 NZqian 创建，旨在通过收集和处理来自 YouTube 的说唱歌曲，为研究人员和开发者提供一个高质量的说唱歌词数据集。RapBank 包含超过 9 ...

2024-12-18AI工具 AI开源项目 AI音乐

R2R：多模态内容解析并结合知识图谱与混合搜索的先进AI检索（RAG）系统

综合介绍 R2R（RAG to Riches）是一个先进的AI检索系统，支持检索增强生成（RAG）功能，具备生产就绪的特性。该系统基于容器化的RESTful API构建，提供多模态内容解析、混合搜索功能、可配置的GraphRAG以及全面的...

2024-12-18AI工具 AI开源项目知识检索与RAG框架

Megrez-3B-Omni：端侧多模态理解模型，支持文本、图像、音频多模态理解和分析

综合介绍 Infini-Megrez是由无问芯穹（Infinigence AI）开发的边缘智能解决方案，旨在通过软硬件协同设计，实现高效的多模态理解和分析。该项目的核心是Megrez-3B模型，支持图像、文本和音频的综合理解，具有高准...

2024-12-18AI工具 AI开源项目多模态实时互动产品

GenEx：从一张图片生成可探索的360° 3D世界（代码逐步开源）

综合介绍 GenEx 是一个先进的人工智能模型，能够从单张图像生成一个完全可探索的360° 3D世界。用户可以交互式地探索这个生成的世界。GenEx 推动了具象化人工智能在想象空间中的发展，并有潜力将这些能力扩展到现...

2024-12-18AI工具 AI开源项目 AI文本与图片转3D

RAGFlow：基于深度文档理解的开源RAG引擎，提供高效的检索增强生成工作流

综合介绍 RAGFlow 是一个开源的检索增强生成（RAG）引擎，基于深度文档理解技术。它为各种规模的企业提供了一个高效的 RAG 工作流，结合了大型语言模型（LLM），能够提供基于复杂格式数据的真实问答能力。RAGFlow...

2024-12-18AI工具 AI开源项目低代码工作流知识检索与RAG框架

NodeTool：基于节点编排的AI模型工作流可视化客户端

综合介绍 NodeTool 是一个创新的AI创作平台，旨在为AI爱好者、开发者、数据科学家和创意人士提供一个简单、直观的界面。无论您是艺术家、开发者还是初学者，NodeTool 都能帮助您快速原型化创意，并通过可视化的无...

2024-12-17AI工具 AI开源项目低代码工作流

Porkybank：AI驱动的日常预算管理，轻松追踪每日预算

综合介绍 Porkybank 是一个开源的个人财务管理应用，旨在帮助用户轻松追踪每日预算。通过简单的公式（收入 - 支出）/ 天数 = 现金，用户可以直观地了解自己的财务状况。该项目托管在 GitHub 上，使用 Elixir 和 P...

2024-12-17AI工具 AI开源项目 AI生活效率助手

CrewAI：多角色扮演协作智能框架，简化复杂任务

综合介绍 CrewAI 是一个先进的框架，旨在协调角色扮演和自主AI代理的协作。通过促进协作智能，CrewAI 使代理能够无缝协作，解决复杂任务。无论是构建智能助手平台、自动化客户服务团队，还是多代理研究团队，Crew...

2024-12-17AI工具 AI开源项目智能体开发框架

Artab：在浏览器打开的新标签页中展示世界名画，Chrome插件

综合介绍 Artab 是一个浏览器扩展程序，旨在每次打开新标签页时展示世界上最伟大的艺术作品。该扩展程序适用于 Chrome、Edge 和 Firefox 浏览器。通过 Artab，用户可以在日常浏览中欣赏到各种经典艺术作品，提升...

2024-12-17AI工具 AI开源项目

Leffa：高保真模特虚拟试穿与人物姿势调整，Meta开源的可控人物图像生成模型

综合介绍 Leffa 是一个用于生成可控人物图像的统一框架，能够精确操控人物的外观（如虚拟试穿）和姿势（如姿势转移）。该框架通过在注意力层中引导目标查询关注正确的参考键，显著减少了细粒度细节的失真，同时保...

2024-12-16AI工具 AI图像风格控制 AI开源项目 AI换脸与换装

MMAudio：为视频画面生成同步音效与配乐，视频到音频的多模态联合训练工具

综合介绍 MMAudio是一个开源项目，旨在通过多模态联合训练生成高质量的同步音频。该项目由香港中文大学的程浩基（Ho Kei Cheng）等人开发，主要功能是根据视频和/或文本输入生成同步音频。MMAudio的核心创新在于...

2024-12-16AI工具 AI开源项目 AI音乐

H2O GPT：灵活配置的本地AI对话与文档处理工具

综合介绍 H2O GPT 是一个开源项目，旨在提供私有化的聊天和文档处理功能。该项目基于 Apache 2.0 许可证，支持多种 GPT 模型，包括 LLaMa2、Mistral、Falcon 等。用户可以通过 H2O GPT 实现对本地文档（如 PDF、E...

2024-12-16AI工具 AI开源项目 AI本地化聊天应用

OpenChat：快速集成多数据源的自定义聊天机器人

综合介绍 OpenChat 是一个用户友好的聊天机器人控制台，旨在简化大语言模型（LLMs）的使用。通过提供两步设置流程，OpenChat 使用户能够轻松创建和管理多个自定义聊天机器人。该平台支持 GPT-3 和 GPT-4 模型，并...

2024-12-16AI工具 AI客服机器人 AI开源项目

LocalGPT：在本地设备上与多文档对话，确保数据隐私

综合介绍 LocalGPT是一个开源项目，旨在让用户在本地设备上与文档进行对话，确保数据隐私。通过使用各种开源模型，LocalGPT可以在不将数据上传到云端的情况下处理和理解文档内容。该项目支持多种平台，包括GPU、C...

2024-12-16AI工具 AI开源项目知识检索与RAG框架

上一页
1
···
35
36
37
38
39
40
41
...
下一页
共 54 页

标签：AI开源项目第38页

Genesis：开源生成式物理引擎，实现基于真实物理的4D动态世界模拟

Kolors：生成高质量图像的文本到图像模型，支持生成中文海报

Trae中文版首发邀请下载：注册后不限量使用DeepSeek-R1！

ColorFlow：漫画着色，黑白图像自动着色，提升图像色彩一致性和质量

BrushEdit：腾讯ARC发布的图像修复和编辑的全能工具

Outlines：通过正则表达式、JSON或Pydantic模型生成结构化文本输出

RapBank：根据歌词和伴奏直接生成说唱(Rap)人声的模型（目前开放了数据集）

R2R：多模态内容解析并结合知识图谱与混合搜索的先进AI检索（RAG）系统

Megrez-3B-Omni：端侧多模态理解模型，支持文本、图像、音频多模态理解和分析

GenEx：从一张图片生成可探索的360° 3D世界（代码逐步开源）

RAGFlow：基于深度文档理解的开源RAG引擎，提供高效的检索增强生成工作流

NodeTool：基于节点编排的AI模型工作流可视化客户端

Porkybank：AI驱动的日常预算管理，轻松追踪每日预算

CrewAI：多角色扮演协作智能框架，简化复杂任务

Artab：在浏览器打开的新标签页中展示世界名画，Chrome插件

Leffa：高保真模特虚拟试穿与人物姿势调整，Meta开源的可控人物图像生成模型

MMAudio：为视频画面生成同步音效与配乐，视频到音频的多模态联合训练工具

H2O GPT：灵活配置的本地AI对话与文档处理工具

OpenChat：快速集成多数据源的自定义聊天机器人

LocalGPT：在本地设备上与多文档对话，确保数据隐私

找不到AI工具？在这试试！

FLUX.1图像生成器（支持中文输入）

近期AI热点

AI工具推荐

AI工具分类

标签：AI开源项目 第38页

找不到AI工具？在这试试！

FLUX.1图像生成器（支持中文输入）

近期AI热点

AI工具推荐

AI工具分类

标签：AI开源项目第38页