AIパーソナル・ラーニング
と実践的なガイダンス
TRAE
合計992記事

タグ: AIのオープンソースプロジェクト 8ページ

DiffSynth-Engine:低现存部署FLUX、Wan2.1的开源引擎-首席AI分享圈

DiffSynth-Engine:オープンソースエンジン、FLUXの低既存デプロイメント用、Wan 2.1

一般的な紹介 DiffSynth-EngineはModelScopeによって立ち上げられたオープンソースプロジェクトで、GitHubでホストされています。拡散モデリング技術に基づいており、画像や動画を効率的に生成することに重点を置き、開発者が本番環境でAIモデルを展開するのに適しています。このプロジェクトはDiffSynth-Studioから発展しました。

RF-DETR:实时视觉对象检测开源模型-首席AI分享圈

RF-DETR:リアルタイム視覚物体検出のためのオープンソースモデル

包括的な紹介 RF-DETRはRoboflowチームによって開発されたオープンソースの物体検出モデルです。RF-DETRはTransformerアーキテクチャをベースとしており、そのコア機能はリアルタイム効率です。このモデルはMicrosoft COCOデータセットにおいて60以上のAPを初めてリアルタイムで検出し、RF100-VLベンチマークにおいても優れたパフォーマンスを達成しました。

Aana SDK:简易部署多模态AI模型的开源工具-首席AI分享圈

Aana SDK: マルチモーダルAIモデルを簡単に導入できるオープンソースツール

一般的な紹介 Aana SDKはMobius Labsによって開発されたオープンソースのフレームワークで、マラヤーラム語のആന(象)にちなんで名付けられました。開発者がマルチモーダルAIモデルを迅速にデプロイ、管理できるように支援し、テキスト、画像、音声、動画、その他のデータの処理をサポートします。Aana SDKはRay Distributed...

PiT:用图像零件拼出完整图像的工具(未开放)-首席AI分享圈

PiT:画像パーツから完全な画像をつなぎ合わせるツール(未開封)

一般的な紹介 PiT(Piece it Together)はGitHubでホストされているオープンソースツールで、テルアビブ大学のエラッド・リチャードソンなどの研究者によって開発された。ユーザーが翼、髪型、目などの画像パーツの断片を入力すると、人工知能技術を使って完全な画像が生成される。

Agent TARS:使用视觉和命令操作电脑的开源智能体-首席AI分享圈

エージェントTARS:視覚とコマンドを使ってコンピュータを操作するオープンソースのインテリジェンス

総合紹介エージェントTARSは、ByteDance社がオープンソース化したマルチモーダルAIインテリジェンスで、ウェブコンテンツを視覚的に理解し、コマンドラインとファイルシステム操作を組み合わせることで、ユーザーが複雑なコンピュータタスクを完了するのを支援するコア機能を備えている。従来のツールのように手動操作を必要とせず、自動的にブラウザ...

Qlib:微软开发的AI量化投资研究工具-首席AI分享圈

Qlib:マイクロソフトが開発したAI定量投資調査ツール

Qlibはマイクロソフトが開発したオープンソースのプラットフォームであり、AI技術を活用してクオンツ投資のリサーチを支援することに主眼を置いている。Qlibは、最も基本的なデータ処理からスタートし、ユーザーが投資アイデアを探求し、使える戦略に変えることをサポートする。このプラットフォームはシンプルで使いやすく、機械学習を使って投資リサーチを改善したいユーザーに適している。

小説を自動的にクロールし、多文字のオーディオブックを生成するツール

概論 Auto-Audio-BookはGitHubでホストされているオープンソースプロジェクトである。ウェブサイトから小説コンテンツを自動的にクロールし、複数のキャラクターの声を持つオーディオブックに変換します。開発者のzqq-nuliはPython 3.10+で書かれており、大規模なモデル(GeminiやCosyVoiceなど)と組み合わされています。

UniAPI:免服务器统一管理大模型API转发-首席AI分享圈

UniAPI:大規模モデルのAPI転送をサーバーレスで統合管理

包括的な紹介 UniAPIはOpenAIプロトコルと互換性のあるAPIフォワーダーで、OpenAI、Azure OpenAI、Claudeなどの複数のビッグモデルサービスプロバイダーのAPIを、統一されたOpenAIフォーマットで管理することを中核機能としています。開発者は、単一のインターフェースを使用することで、異なるベンダーのモデルを頻繁に呼び出す必要がなくなります。

Oliva:语音控制的多智能体产品搜索助手-首席AI分享圈

Oliva:音声制御のマルチインテリジェンス製品検索アシスタント

概要 OlivaはDeluxerがGitHubで開発したオープンソースのマルチインテリジェンスアシスタントツールです。複数のAIインテリジェンスの連携により、Qdrantデータベースの商品情報検索を支援します。主な機能は音声サポートで、LangChainやSuperlinked技術と組み合わ...

Playwright MCP:微软推出的浏览器自动化MCP服务-首席AI分享圈

Playwright MCP:マイクロソフトのブラウザ自動化MCPサービス

一般的な紹介 Playwright MCPはMicrosoftによって開発され、GitHubでホストされているオープンソースツールです。モデルコンテキストプロトコル(MCP)プロトコルを介して、人工知能モデルがブラウザを直接制御し、ウェブページを開いたり、要素をクリックしたり、テキストを入力したりといったアクションを実行することができる。このツールはPl...

PDF Craft:PDF扫描文件转Markdown的开源工具-首席AI分享圈

PDF Craft: PDFスキャン文書からMarkdownへのオープンソースツール

一般的な紹介 PDF Craftは、書籍のPDFをスキャンしてMarkdown形式に変換するために設計されたオープンソースツールです。このツールはoomol-labによって開発され、電子書籍の整理が好きなユーザのためにGitHubでホストされています。このツールは、インターネットに接続することなく、ローカルのAIモデルを通して実行されます。

InfiniteYou:保留人脸特征的照片生成与编辑工具-首席AI分享圈

InfiniteYou:顔の特徴を保持する写真生成・編集ツール

概要 InfiniteYouは、ByteDance Intelligent Creationチームによって開発されたオープンソースプロジェクトです。FLUX.1-devモデルを使用し、Diffusion Transformers (DiTs)技術に基づいています。中心的な機能は、ユーザーが写真をアップロードし、テキスト説明を入力して、人物のアイデンティティ特性を保持しながら、新しい画像を生成できるようにすることです。プロジェクト...

Grok-Mirror:一键部署可盈利的Grok镜像站-首席AI分享圈

Grok-Mirror:収益性の高いGrokミラーサイトのワンクリック展開

包括的な紹介 Grok-Mirrorはサーバーレスの迅速なデプロイ Grok3ベースの国内ミラーステーションです。 Grokミラーステーションは操作可能なように構築されています。GrokはxAIが立ち上げたAIアシスタントで、Grok-Mirrorはミラーリング技術により、...

LHM:从单张图片生成支持动作的3D人体模型-首席AI分享圈

LHM:1枚の画像から動き対応の3D人体モデルを生成する

包括的な紹介 LHM(Large Animatable Human Reconstruction Model)は、aigc3dチームによって開発されたオープンソースプロジェクトで、1枚の画像からアクションをサポートする3D人体モデルを素早く生成します。核となる機能は、AI技術を使用して2D画像を数秒で3Dモデルに変換することであり、リアルタイムのプレビューと...

Second Me:本地训练拥有个人记忆和习惯的AI分身-首席AI分享圈

セカンド・ミー:個人的な記憶と習慣を持つ、現地で訓練されたAIドッペルゲンガー

Second MeはMindverseチームによって開発されたオープンソースプロジェクトで、あなたのコンピューター上に「デジタル・ドッペルゲンガー」のような働きをするAIを作り、あなたの言葉や記憶を通してあなたの話し方や習慣を学習し、あなたを理解するスマート・アシスタントに変えることができる。その最大の特徴は、すべての数字...

openapi-mcp-server:让AI直接调用开放API的MCP服务-首席AI分享圈

openapi-mcp-server: AIがオープンAPIを使ってMCPサービスを直接呼び出せるようにする。

概論 openapi-mcp-serverは、OpenAPI v3.1に準拠したAPIをAIで利用可能なリソースに変換するために設計されたオープンソースのツールです。janwilmakeによってメンテナンスされ、モデルコンテキストプロトコル(MCP)プロトコルに基づいて開発されています。このプロジェクトの中心的な機能は、APIプロキシとして機能することで、Open...

检测MCP服务安全风险的开源工具-首席AI分享圈

MCPサービスのセキュリティリスクを検出するオープンソースツール

概要 mcp-is-dangerousは、Shaojie JiangがGitHubで開発したオープンソースツールである。このツールは、簡単なPythonコードを通して、ユーザーがAIツールを使ってMCP(Model Context Protocol)サービスのセキュリティリスクを検出するのを助ける。このツールは、外部ツールが...

StarVector:从图像和文字生成SVG矢量图的基础模型-首席AI分享圈

StarVector: 画像とテキストからSVGベクターグラフィックスを生成するための基本モデル

一般的な紹介 StarVectorは、画像やテキストをScalable Vector Graphics(SVG)に変換するために、Juan A. Rodriguezなどの開発者によって作成されたオープンソースプロジェクトです。このツールは、画像コンテンツとテキスト命令を理解する視覚言語モデルを使用して、高品質のSVGコードを生成します。

CortexON:开源多代理AI工具,支持复杂任务自动化-首席AI分享圈

CortexON:複雑なタスクの自動化をサポートするオープンソースのマルチエージェントAIツール

概論 CortexONは、GitHub(https://github.com/TheAgenticAI/CortexOn)でホストされているオープンソースのマルチエージェントAIシステムである。TheAgenticAIチームによって開発され、ManusとOpenAI DeepResearchに触発された。その目的は、システムを複数の...

ja日本語