
Skywork-R1V:昆仑万文开源的图文混合多模态推理模型
综合介绍 Skywork-R1V 是由 SkyworkAI(昆仑万维) 团队开发的一款开源多模态推理模型,发布于 GitHub。它能同时处理图像和文字,进行多步骤逻辑推理,特别擅长分析复杂图像问题。这款模型在2025年3月18日正式推...
综合介绍 Skywork-R1V 是由 SkyworkAI(昆仑万维) 团队开发的一款开源多模态推理模型,发布于 GitHub。它能同时处理图像和文字,进行多步骤逻辑推理,特别擅长分析复杂图像问题。这款模型在2025年3月18日正式推...
Mistral AI 近日宣布推出其最新模型 Mistral Small 3.1,并声称这是目前同等量级模型中的最佳选择。 这款新型号建立在 Mistral Small 3 的基础上,在文本性能、多模态理解以及上下文处理能力上都得到了显著提升,...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 JigsawStack 是一个专为开发者打造的AI工具平台。它提供多种小型AI模型的API服务,帮助用户快速集成功能到自己的应用程序中。核心特点是速度快,全球延迟低至200毫秒,可用性高达99.5%。平台支持网页抓...
在信息爆炸的时代,如何从海量数据中快速、精准地定位关键信息,已成为企业和个人知识管理的核心挑战。近日,Dify 产品团队发布了 v1.1.0 版本,并创新性地推出了以“元数据”为核心的知识过滤器功能。这项更新犹如...
综合介绍 AI Logo 是一个开源的AI应用项目,目标是帮助用户通过人工智能快速生成个性化的品牌标志。它结合了强大的AI技术,比如Stable Diffusion和DeepAI,让用户输入简单的品牌信息就能得到高质量的Logo设计。这...
综合介绍 Docs 是一个开源的协作笔记和文档管理平台,由 suitenumerique 团队开发。它使用 Django 和 React 技术构建,目标是提供一个简单易用的工具,帮助用户记录笔记、管理文档并分享知识。这个平台支持多人实...
OCR 技术能够将图像中的文字信息转换为可编辑和可处理的文本数据。简单来说,就是识别和提取图片上的文字。 接下来,我们将深入评测 GitHub 上 Star 数最多的 10 个 OCR 开源项目,为你提供一份详尽的 OCR 工具选...
综合介绍 SmartRead 是一个基于 AI 的开源工具,专为技术文档设计。它能自动分析 PDF 文件,标注关键内容,比如重要术语、标题或核心观点,帮助用户快速理解复杂文档。同时,它还能提供与文档主题相关的文章和视...
综合介绍 Hunyuan3D-2 是腾讯开发的一个开源项目,旨在通过文字或图像生成高分辨率的3D模型。它由两个核心部分组成:形状生成模型(Hunyuan3D-DiT)和纹理生成模型(Hunyuan3D-Paint)。用户可以输入文字描述或上...
综合介绍 LangManus 是一个开源的 AI 自动化框架,托管在 GitHub 上。它由一群前同事在业余时间开发,属于学术驱动项目,目标是结合语言模型和专用工具,完成网页搜索、数据爬取和代码执行等任务。框架采用多代理...
Gemini 最近更新有些频繁,非顺序整理: 正式上线 Veo2 推理模型在 Google AI Studio 、Gemini(缩水版) 分别上线 原生支持图像生成编辑的多模态模型:Gemini 2.0 Flash (现在标准名称是:Gemini 2.0 Fl...
摘要 信息检索系统对于有效访问大型文档集合至关重要。最近的方法利用大型语言模型(LLMs)通过查询增强来提高检索性能,但通常依赖于昂贵的监督学习或蒸馏技术,这些技术需要大量的计算资源和手工标注的数据。在...
综合介绍 Cursor Talk to Figma MCP 是一个开源项目,通过 Model Context Protocol (MCP) 协议连接 AI 编程工具 Cursor 和设计软件 Figma。它由开发者 Sonny Lazuardi 创建,托管在 GitHub 上,发布时间为2025年3...
综合介绍 XianyuAutoAgent 是一个专为闲鱼平台设计的智能客服机器人系统,由开发者 shaxiu 在 GitHub 上开源。它通过 AI 技术实现 7×24 小时自动值守,帮助闲鱼卖家回复消息、处理议价和技术咨询。核心功能包括上...
综合介绍 Seed-VC 是一个开源项目,地址在 GitHub 上,由 Plachtaa 开发。它能用一段 1 到 30 秒的参考音频,快速实现语音或歌声转换,不需要额外训练。项目支持实时语音转换,延迟低至 400 毫秒左右,适合在线会...
综合介绍 PilottAI 是一个开源的 Python 框架,托管在 GitHub 上,由开发者 anuj0456 创建。它专注于帮助用户构建企业级的多智能体系统,支持大语言模型(LLM)集成,提供任务编排、动态扩展和容错机制等功能。Pi...
综合介绍 HumanOmni 是由 HumanMLLM 团队开发的一个开源多模态大模型,托管在 GitHub 上。它专注于分析人类视频,能同时处理画面和声音,帮助理解情感、动作和对话内容。项目用了 240 万个以人为中心的视频片段和...
综合介绍 Aha 是全球首款使用AI团队专注网红营销的工具,由Aha Labs开发。它提供一个24小时在线的AI代理团队,帮助用户启动、管理和扩大网红营销活动。用户输入品牌或网站信息,AI会自动完成任务,比如匹配网红、...
中国互联网巨头阿里巴巴正大举进军人工智能(AI)领域。据报道,阿里巴巴 CEO 吴泳铭已明确提出,要在公司现有业务中全面实现 AI 驱动。 阿里巴巴在港交所发布公告(2月24日),计划在未来三年内投入至少 3800 亿...