
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟
综合介绍 Genesis 是一个为通用机器人和具身 AI 学习设计的生成性物理世界。它提供了一个统一的仿真平台,支持多种材料和物理现象的模拟。Genesis 旨在通过结合生成性 AI 和物理仿真,解锁无限多样的数据,帮助机...
综合介绍 Genesis 是一个为通用机器人和具身 AI 学习设计的生成性物理世界。它提供了一个统一的仿真平台,支持多种材料和物理现象的模拟。Genesis 旨在通过结合生成性 AI 和物理仿真,解锁无限多样的数据,帮助机...
综合介绍 Kolors是由快手团队开发的大规模文本到图像生成模型,基于潜在扩散技术。该模型训练于数十亿对文本-图像数据对,能够生成高质量、复杂语义准确的图像,并支持中英文输入。Kolors在视觉质量、复杂语义准...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 ColorFlow是由腾讯ARC团队开发的图像序列自动着色工具,旨在解决黑白图像序列的自动着色问题。该工具利用检索增强的着色管道,通过参考图像池准确生成各种元素的颜色,包括角色的头发颜色和服装,确保颜...
综合介绍 BrushEdit 是由腾讯ARC实验室开发的一款全能图像修复和编辑工具。该工具基于最新的AI技术,能够自动识别和修复图像中的缺陷,同时支持用户进行交互式编辑。BrushEdit 结合了多种先进的图像处理算法,提...
综合介绍 Outlines 是一个由 dottxt-ai 开发的开源库,旨在通过结构化文本生成来提升大语言模型(LLM)的应用能力。该库支持多种模型集成,包括 OpenAI、transformers、llama.cpp 等,提供简单而强大的提示原语,...
综合介绍 RapBank 是一个专为说唱歌词生成而设计的数据集和工具集。该项目由 NZqian 创建,旨在通过收集和处理来自 YouTube 的说唱歌曲,为研究人员和开发者提供一个高质量的说唱歌词数据集。RapBank 包含超过 9 ...
综合介绍 R2R(RAG to Riches)是一个先进的AI检索系统,支持检索增强生成(RAG)功能,具备生产就绪的特性。该系统基于容器化的RESTful API构建,提供多模态内容解析、混合搜索功能、可配置的GraphRAG以及全面的...
综合介绍 Infini-Megrez是由无问芯穹(Infinigence AI)开发的边缘智能解决方案,旨在通过软硬件协同设计,实现高效的多模态理解和分析。该项目的核心是Megrez-3B模型,支持图像、文本和音频的综合理解,具有高准...
综合介绍 GenEx 是一个先进的人工智能模型,能够从单张图像生成一个完全可探索的360° 3D世界。用户可以交互式地探索这个生成的世界。GenEx 推动了具象化人工智能在想象空间中的发展,并有潜力将这些能力扩展到现...
综合介绍 RAGFlow 是一个开源的检索增强生成(RAG)引擎,基于深度文档理解技术。它为各种规模的企业提供了一个高效的 RAG 工作流,结合了大型语言模型(LLM),能够提供基于复杂格式数据的真实问答能力。RAGFlow...
综合介绍 NodeTool 是一个创新的AI创作平台,旨在为AI爱好者、开发者、数据科学家和创意人士提供一个简单、直观的界面。无论您是艺术家、开发者还是初学者,NodeTool 都能帮助您快速原型化创意,并通过可视化的无...
综合介绍 Porkybank 是一个开源的个人财务管理应用,旨在帮助用户轻松追踪每日预算。通过简单的公式(收入 - 支出)/ 天数 = 现金,用户可以直观地了解自己的财务状况。该项目托管在 GitHub 上,使用 Elixir 和 P...
综合介绍 CrewAI 是一个先进的框架,旨在协调角色扮演和自主AI代理的协作。通过促进协作智能,CrewAI 使代理能够无缝协作,解决复杂任务。无论是构建智能助手平台、自动化客户服务团队,还是多代理研究团队,Crew...
综合介绍 Artab 是一个浏览器扩展程序,旨在每次打开新标签页时展示世界上最伟大的艺术作品。该扩展程序适用于 Chrome、Edge 和 Firefox 浏览器。通过 Artab,用户可以在日常浏览中欣赏到各种经典艺术作品,提升...
综合介绍 Leffa 是一个用于生成可控人物图像的统一框架,能够精确操控人物的外观(如虚拟试穿)和姿势(如姿势转移)。该框架通过在注意力层中引导目标查询关注正确的参考键,显著减少了细粒度细节的失真,同时保...
综合介绍 MMAudio是一个开源项目,旨在通过多模态联合训练生成高质量的同步音频。该项目由香港中文大学的程浩基(Ho Kei Cheng)等人开发,主要功能是根据视频和/或文本输入生成同步音频。MMAudio的核心创新在于...
综合介绍 H2O GPT 是一个开源项目,旨在提供私有化的聊天和文档处理功能。该项目基于 Apache 2.0 许可证,支持多种 GPT 模型,包括 LLaMa2、Mistral、Falcon 等。用户可以通过 H2O GPT 实现对本地文档(如 PDF、E...
综合介绍 OpenChat 是一个用户友好的聊天机器人控制台,旨在简化大语言模型(LLMs)的使用。通过提供两步设置流程,OpenChat 使用户能够轻松创建和管理多个自定义聊天机器人。该平台支持 GPT-3 和 GPT-4 模型,并...
综合介绍 LocalGPT是一个开源项目,旨在让用户在本地设备上与文档进行对话,确保数据隐私。通过使用各种开源模型,LocalGPT可以在不将数据上传到云端的情况下处理和理解文档内容。该项目支持多种平台,包括GPU、C...