首席AI分享圈-AI个人学习和实操指南-最新发布-第21页

🚀邀请体验：中国首家 AI IDE 智能编程软件 Trae 中文版下载，不限量使用 DeepSeek-R1 和 Doubao-pro!

RF-DETR：实时视觉对象检测开源模型

综合介绍 RF-DETR 是 Roboflow 团队开发的一个开源对象检测模型。它基于 Transformer 架构，核心特点是实时高效。模型在微软 COCO 数据集上首次实现超过 60 AP 的实时检测，同时在 RF100-VL 基准测试中表现突出，...

2025-03-25AI工具 AI开源项目视觉目标检测

Aana SDK：简易部署多模态AI模型的开源工具

综合介绍 Aana SDK 是一个开源框架，由 Mobius Labs 开发，名字源于马拉雅拉姆语“ആന”（大象）。它帮助开发者快速部署和管理多模态 AI 模型，支持处理文本、图像、音频和视频等多种数据。Aana SDK 基于 Ray 分布式...

2025-03-25AI工具 AI开源项目本地部署开源大模型工具

Trae中文版首发邀请下载：注册后不限量使用DeepSeek-R1！

开启 Builder 智能编程模式，无限量使用 DeepSeek-R1 和 DeepSeek-V3 ，对比海外版体验更加流畅。只需输入中文指令，不懂编程的小白也可以零门槛编写自己的应用。

2025-04-30

PiT：用图像零件拼出完整图像的工具（未开放）

综合介绍 PiT（Piece it Together）是一个开源工具，托管在 GitHub 上，由特拉维夫大学的 Elad Richardson 等研究者开发。它能让用户输入零散的图像零件，比如翅膀、发型或眼睛，然后用人工智能技术生成一张完整...

2025-03-25AI工具 AI图像编辑 AI图像风格控制 AI开源项目

Agent TARS：使用视觉和命令操作电脑的开源智能体

综合介绍 Agent TARS 是一个由字节跳动开源的多模态 AI 智能体，核心特点是通过视觉理解网页内容，并结合命令行和文件系统操作，帮助用户完成复杂的电脑任务。它不像传统工具需要手动操作，而是能自动执行浏览器...

2025-03-25AI工具 AI开源项目桌面自动化智能体

全新 Qwen2.5-VL-32B-Instruct 多模态模型发布，性能超72B！

近日，备受瞩目的 Qwen2.5-VL 系列模型再添新成员—— Qwen2.5-VL-32B-Instruct 正式开源发布。这款 320 亿参数规模的多模态视觉语言模型，在继承 Qwen2.5-VL 系列优势的基础上，通过强化学习等技术进一步优化，实...

2025-03-25AI新闻

Qlib：微软开发的AI量化投资研究工具

综合介绍 Qlib 是微软开发的一个开源平台，专注于用 AI 技术帮助用户研究量化投资。它从最基本的数据处理开始，支持用户探索投资想法并将其变成可用的策略。平台简单易用，适合想用机器学习提升投资研究的用户。Q...

2025-03-25AI工具 AI开源项目 AI金融数据分析

Reve.art：兼具美学和镜头感的图像生成平台

综合介绍 Reve.art 是一个由人工智能驱动的图像生成平台，主打产品是 Reve Image 1.0（也叫 Halfmoon）。它由美国加州 Alto 的 Reve AI, Inc. 团队开发，这个团队由研究员、工程师、设计师和故事讲述者组成，致力...

2025-03-25AI工具 AI在线生成图像

Zapier 推出 MCP 集成服务，连接8000+应用

在人工智能（AI）领域，大型语言模型（LLM）的发展日新月异，它们在文本生成和对话互动方面展现出惊人的能力。然而，如何将 AI 的强大功能真正融入到实际应用场景中，使其不再仅仅停留在“聊天”层面，而是能够执行...

2025-03-25AI新闻

Cloudsquid：上传文档并描述要求智能提取结构化数据

综合介绍 Cloudsquid 是一家 2023 年成立于德国柏林的公司，专注于用人工智能简化文件处理。它的核心产品是一个在线数据提取平台，用户只需上传 PDF、图片、音频、视频等文件，简单说明需要提取的数据，比如“找出...

2025-03-25AI工具文档提取与清洗

Fast.io：AI快速分析大规模企业数据并提供决策

综合介绍 Fast.io 是一个为团队设计的 AI 工作平台，专注于将大规模数据转化为实用洞察。它能快速分析数千个文件，包括文档、图片和视频，生成总结并回答问题。网站由 MediaFire 创始人打造，目标是帮助中小企业...

2025-03-25AI工具专业生产力工具知识检索与RAG框架

自动爬取小说并生成多角色有声书的工具

综合介绍 Auto-Audio-Book 是一个开源项目，托管在 GitHub 上。它能自动从网站爬取小说内容，并将其转换为带有多角色配音的有声书。开发者 zqq-nuli 使用 Python 3.10+ 编写，结合大模型（如 Gemini 和 CosyVoice...

2025-03-25AI工具 AI副业赚钱项目 AI开源项目

UniAPI：免服务器统一管理大模型API转发

综合介绍 UniAPI 是一个兼容 OpenAI 协议的 API 转发器，核心功能是通过统一的 OpenAI 格式管理多个大模型服务商的 API，比如 OpenAI、Azure OpenAI、Claude 等。开发者可以用一个接口调用不同厂商的模型，无需频...

2025-03-25AI工具 AI开源项目

Oliva：语音控制的多智能体产品搜索助手

综合介绍 Oliva 是一个开源的多智能体助手工具，由 Deluxer 在 GitHub 上开发。它通过多个 AI 智能体协作，帮助用户在 Qdrant 数据库中搜索产品信息。主要特点是支持语音操作，结合 LangChain 和 Superlinked 技...

2025-03-24AI工具 AI开源项目智能体应用知识检索与RAG框架

Playwright MCP：微软推出的浏览器自动化MCP服务

综合介绍 Playwright MCP 是微软开发的一款开源工具，托管在 GitHub 上。它通过 Model Context Protocol（MCP）协议，让人工智能模型能直接控制浏览器，完成打开网页、点击元素、输入文字等操作。这个工具基于 Pl...

2025-03-24AI工具 AI开源项目 MCP服务桌面自动化智能体

PDF Craft：PDF扫描文件转Markdown的开源工具

综合介绍 PDF Craft 是一个开源工具，专为扫描书籍的PDF设计，能将其转换为Markdown格式。它由 oomol-lab 开发，托管在 GitHub 上，适合喜欢整理电子书的用户。工具通过本地AI模型运行，无需联网，既保护隐私又方...

2025-03-24AI工具 AI开源项目 OCR 文档提取与清洗

InfiniteYou：保留人脸特征的照片生成与编辑工具

综合介绍 InfiniteYou 是 ByteDance 智能创作团队开发的一个开源项目。它基于扩散变换器（DiTs）技术，使用 FLUX.1-dev 模型，核心功能是让用户上传照片并输入文字描述，生成新图像，同时保留人物身份特征。项目...

2025-03-24AI工具 AI图像风格控制 AI开源项目

免部署、0成本使用 Deep Research Web UI

Deep Research Web UI 是一款由 AI 驱动的智能研究可视化工具。它整合了搜索引擎、网络抓取和大语言模型等先进技术，能够自动对复杂问题进行深度挖掘，并生成结构完整的研究报告。该工具强调用户的数据安全和部署...

2025-03-24AI实操教程

代码编辑器也能画画？这款 MCP 让 Cursor 变身画板

近日，一款可以生成图像的 MCP 服务引起了我的的关注。该服务基于 Together AI，可与 Cursor 等代码编辑器集成，让开发者无需离开熟悉的编码环境，就能体验 AI 绘图的乐趣。据悉，MCP Server 利用了 Together AI...