AIパーソナル・ラーニング
と実践的なガイダンス
TRAE
合計992記事

タグ: AIのオープンソースプロジェクト 6ページ

アヌビス:作業負荷の証明を通じてAIクローラーのクローリングを妨害する

一般的な紹介 Anubisは、AIクローラーからウェブサイトを保護するためにTecharoHQチームによって開発されたオープンソースツールです。HTTPリクエストにSHA256 Proof-of-Workチャレンジを追加し、訪問者に計算タスクを完了させることで、非準拠のWebサイトをブロックします。

OmniSQL:将自然语言转化为高质量SQL查询的模型-首席AI分享圈

OmniSQL: 自然言語を高品質なSQLクエリに変換するモデル

概論 OmniSQLはRUCKBReasoningチームによって開発され、GitHubでホストされているオープンソースプロジェクトである。このプロジェクトの中心的な機能は、ユーザが入力した自然言語の質問を高品質なSQLクエリ文に変換し、ユーザがデータベースを簡単に操作できるようにすることである。このプロジェクトは、自動化されたテキスト...

LatentSync:用音频直接生成唇形同步视频的开源工具-首席AI分享圈

LatentSync: 音声から直接リップシンクされたビデオを生成するオープンソースツール

概要 LatentSyncはByteDanceによって開発され、GitHubでホストされているオープンソースツールです。音声を通して動画内のキャラクターの唇の動きを直接駆動し、口の形を音声に正確に一致させることができます。このプロジェクトは、Stable Diffusionの潜在拡散モデルに基づいています。

Morphik Core:处理多模态数据的开源 RAG 平台-首席AI分享圈

Morphik Core:マルチモーダルデータ処理のためのオープンソースRAGプラットフォーム

一般的な紹介 Morphik Coreはmorphik-orgチームによって開発され、GitHubでホストされているオープンソースプロジェクトです。以前はDataBridge Coreと呼ばれていましたが、現在はMorphik Coreと改名されています。このツールはAIアプリケーションのために設計されたデータベースで、テキスト、画像、PDF、動画、その他様々なデータを扱うことができます。

基于Workers AI免费将多种文件转为Markdown格式-首席AI分享圈

Workers AIに基づいて、無料で複数のファイルをMarkdown形式に変換する

一般的な紹介 serverless-markdown-convertorは、Cloudflare WorkerとWorkers AI開発に基づいて、様々なファイルをMarkdown形式に変換することができる無料のオープンソースツールです。PDF、画像、Office文書、HTML、その他の一般的なファイル形式をサポートしており、自分で変換する必要はありません。

EditorJumper:Cursor/Trae/Windsurf和JetBrains无缝切换工具-首席AI分享圈

EditorJumper:Cursor/Trae/WindsurfとJetBrainsのシームレスな切り替えツール

概要 EditorJumperは、JetBrains IDE用に設計されたプラグインで、GitHubユーザーのwanniwaによって開発されました。このプラグインを使うと、開発者はJetBrains IDE(IntelliJ IDEAやPyCharmなど)とVS Code、Cursor、Trae、Windsurfなどのエディタとの間を素早く行き来することができます。

VirtualWife:支持B站直播和语音互动的二次元数字人-首席AI分享圈

バーチャル・ワイフ:Bステーションのライブ・ストリーミングと音声インタラクションをサポートする第二のデジタル・パーソン

VirtualWifeは、開発者yakami129によって作られたオープンソースのバーチャルデジタルパーソンプロジェクトである。現在インキュベーション段階にあり、「魂」を持ったバーチャル・キャラクターを作成することが目標で、ユーザーは友人のように交流することができる。このプロジェクトはBステーションのライブストリーミングをサポートし、中国語の音声とテキストでコミュニケーションすることができます。

GPT-Crawler:自动爬取网站内容生成知识库文件-首席AI分享圈

GPT-Crawler: ウェブサイトコンテンツを自動的にクロールして知識ベースドキュメントを生成

一般的な紹介 GPT-Crawlerは、BuilderIOチームによって開発され、GitHubでホストされているオープンソースツールです。1つ以上のウェブサイトのURLを入力することで、ページのコンテンツをクロールし、カスタムGPTやAIアシスタントを作成するための構造化ナレッジファイル(output.json)を生成します。ユーザーは...

MegaTTS3:合成中英文语音的轻量模型-首席AI分享圈

MegaTTS3:中国語音声と英語音声を合成する軽量モデル

包括的な紹介 MegaTTS3は、ByteDanceが浙江大学と共同で開発したオープンソースの音声合成ツールで、高品質な中国語と英語の音声を生成することに重点を置いています。MegaTTS3のコアモデルは0.45Bのパラメータしかなく、軽量で効率的です。プロジェクトはGitHubでホストされており、...

KBLaM:为大模型嵌入外部知识的开源增强工具-首席AI分享圈

KBLaM:大規模モデルに外部知識を埋め込むためのオープンソース拡張ツール

KBLaMはMicrosoftによって開発されたオープンソースプロジェクトで、知識ベース拡張言語モデル(KBLaM)として知られている。KBLaMは、外部の知識をベクトルに変換し、大規模なモデルのアテンションレイヤーに埋め込みます。

LangGraph CodeAct:複雑なタスクを解決する知能を支援するコード生成

概要 LangGraph CodeActは、LangChain AIチームによってGitHubでオープンソース化されたフレームワークで、CodeActアーキテクチャに基づいています(詳細は論文arXiv:2402.01030を参照)。Pythonコードを生成・実行することで、インテリジェンスが複雑なタスクを効率的に処理できるようにする。このツールはManus...

BrowserTools MCP:实时监控浏览器活动的MCP服务-首席AI分享圈

BrowserTools MCP: ブラウザの動作をリアルタイムで監視するMCPサービス

概要 BrowserTools MCPは、AgentDeskAIチームによって開発されたオープンソースプロジェクトです。AIがログ、ネットワークリクエスト、スクリーンショットを含むブラウザのアクティビティをリアルタイムで監視し、ChromeエクステンションやNode.jsサービスを通じてウェブパフォーマンス、SEO、アクセシビリティを分析することを可能にします。

AgentLaboratory:利用智能代理完成科研全流程的开源工具-首席AI分享圈

AgentLaboratory: 知的エージェントによる科学研究の全プロセスを完了するオープンソースツール

概要 AgentLaboratoryは、Samuel Schmidgallによって開発された、GitHubでホストされているオープンソースツールです。大規模言語モデル(LLM)によって駆動されるインテリジェントエージェントを使用し、文献レビュー、実験デザイン、レポート作成を含む科学研究の全プロセスにおいて研究者を支援します。このツールの...

Kilo Code:具有简洁使用体验的Roo Code分支-首席AI分享圈

キロ・コード:クリーンなユーザー・エクスペリエンスを備えたルー・コードのブランチ

一般的な紹介 キロコードは、Visual Studio Code(略してVS Code)のオープンソース拡張プラグインです。人工知能技術を使って、ユーザーがより効率的にコードを書けるようにする。このプロジェクトはKilo-Orgチームによって開発され、当初はRoo Codeからフォークされ、その後、より多くの機能を追加しています。

AgentIQ:灵活连接和管理AI智能体的开源工具-首席AI分享圈

AgentIQ: AIインテリジェンスの柔軟な接続と管理のためのオープンソースツール

概要 AgentIQは、開発者がAIインテリジェンスを効率的に接続・管理できるように設計されたNVIDIAのオープンソースツールです。異なるフレームワークのインテリジェンスがシームレスに連携し、企業データとツールを接続し、関数を呼び出すようなワークフローを構築することを可能にします。このツールの最大の特徴は、柔軟性とリ...

MIDI-3D:从单张图片快速生成多物体3D场景的开源工具-首席AI分享圈

MIDI-3D: 1枚の画像からマルチオブジェクトの3Dシーンを高速生成するオープンソースツール

概論 MIDI-3Dは、VAST-AI-Researchチームによって開発されたオープンソースプロジェクトで、開発者、研究者、クリエイターのために、1つの画像から複数のオブジェクトを含む3Dシーンを素早く生成します。このツールはマルチインスタンス拡散モデリング技術に基づいており、人工知能と3Dモデリングを組み合わせています。

TripoSF:快速生成高分辨率3D模型的实用工具-首席AI分享圈

TripoSF:高解像度3Dモデルを迅速に生成する実用的なツール

一般的な紹介 TripoSFはVAST-AI-Researchチームによって構築されたオープンソースプロジェクトで、特に1枚の画像から高解像度の3Dモデルを素早く生成するように設計されています。SparseFlexと呼ばれる技術を使用しており、処理効率に優れ、一般的なデバイスで動作させることができます。TripoSFのコードと事前学習モデル...

TripoSG:单张图像生成高分辨率3D建模数字资产-首席AI分享圈

TripoSG: 1枚の画像から高解像度の3Dモデリングデジタル資産を生成

概論 TripoSGはVAST AI研究チームによって開発されたオープンソースプロジェクトで、1枚の画像から高品質な3Dモデルを生成する。このプロジェクトでは、大規模な整流器フローコンバーター技術を用い、ハイブリッド教師あり学習と高品質なデータセットを組み合わせることで、幾何学的な詳細が明確で複雑な3Dモデルの生成を可能にしている。

ja日本語