AIパーソナル・ラーニング
と実践的なガイダンス
TRAE
合計1020記事

タグ: AIのオープンソースプロジェクト 33ページ

GitPodcast:将GitHub仓库转化为播客,随时随地收听代码更新-首席AI分享圈

GitPodcast: GitHubのリポジトリをポッドキャストにして、いつでもどこでもコードの更新を聞くことができます!

一般的な紹介 GitPodcastは、GitHubのリポジトリをポッドキャストに変え、開発者がいつでもどこでもコードの更新を聞けるように設計された革新的なツールです。OpenAIとAzure Speech SDKを使って、GitPodcastはGitHubリポジトリをコミットログ、プルリクエスト、マイレージのポッドキャストに変えることができます。

Paperless-AI:使用AI自动分析和标记文档,适用 paperless-ngx 文档管理系统-首席AI分享圈

Paperless-AI: Paperless-NGX文書管理システムのためのAIを使った文書の自動分析とタグ付け

概要 Paperless-AIは、Paperless-ngx文書管理システム専用に設計された革新的な文書自動化分析ツールです。OpenAI APIと、Ollama(Mistral、LLaMA、PHI-3、Gemma 2を含む)、...といった様々な先進AIモデルを巧みに組み合わせています。

Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台-首席AI分享圈

Cosmos:ワールド・ベース・モデル、物理世界のAIベース・モデルを構築するためのプラットフォーム

包括的な紹介 NVIDIA Cosmosは、物理AI開発者がより良く、より速く物理AIシステムを構築できるように特別に設計された、開発者向けのワールドベースモデルプラットフォームです。このプラットフォームは、拡散や自己回帰をベースとしたワールドベースモデルを含む、様々な訓練済みモデルを提供します。

Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体-首席AI分享圈

ミニLLMフロー:100行のコードで「有向グラフ構造」を持つLLMミニインテリジェントを構築する

概論 miniLLMFlowは、「道は単純である」という設計哲学を強調した、わずか100行のコアコードからなる最小主義の大規模言語モデル(LLM)開発フレームワークです。このフレームワークは、AIアシスタント(ChatGPT、Claudeなど)を自律的にプログラムできるようにするために特別に設計されており、マルチインテリジェンス、タスク分解、...

小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动-首席AI分享圈

Xiaozhi AIチャットボット:AIチャットコンパニオンを構築、簡単な音声対話とインテリジェントな対話

包括的な紹介 Xiaozhi AI Chatbotは、ESP32開発ボードをベースにしたオープンソースプロジェクトで、ユーザーが独自のAIチャットコンパニオンを構築できるように設計されています。このプロジェクトはShrimpによって開発され、より多くの人がAIハードウェア開発を始め、大きな言語モデルを実際のハードウェアデバイスに適用する方法を理解するための教育目的で主に使用されています...

OpenAI Realtime API Next.js:构建实时语音对话AI应用的Next.js模板-首席AI分享圈

OpenAI Realtime API Next.js: リアルタイムの音声対話AIアプリケーションを構築するためのNext.jsテンプレート

包括的な紹介 OpenAI Realtime API Next.jsはNext.jsフレームワークをベースとしたオープンソースプロジェクトで、開発者がリアルタイム音声AIアプリケーションを素早く構築できるように設計されています。このプロジェクトは、OpenAIのリアルタイムAPIとWebRTC技術を統合し、モダンなUIコンポーネントとツールコールを提供します。このプロジェクトを使用することで ...

Auto-Coder.Chat:基于终端命令行的AI辅助编程助手,提供VSCode插件-首席AI分享圈

Auto-Coder.Chat:VSCodeプラグインを備えたターミナル・コマンドライン・ベースのAI支援プログラミング・アシスタント

Auto-Coder.Chatは、インテリジェントな手段によって開発者のプログラミング効率を向上させるために設計された、端末ベースのAI支援プログラミングツールです。Auto-Coder.Chatは、複数のプログラミング言語と...

Kokoro:高效语音合成模型,生成自然流畅的语音-首席AI分享圈

こころ:自然で滑らかな音声を生成する効率的な音声合成モデル

一般的な紹介 ココロ82MはHugging Faceが提供する効率的な音声合成モデルで、少ないパラメータとデータで高品質な音声を生成するように設計されています。このモデルは8,200万個のパラメータを持ち、Apache 2.0ライセンスの下で配布され、幅広い音声パック(Voicepacks)をサポートしています。

WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表-首席AI分享圈

WrenAI: 回答、SQLクエリ、分析レポートに直接アクセスできる会話型データ分析AIアシスタント

概要 WrenAIは、データチーム、製品チーム、ビジネスチームが自然言語での会話を通じてデータの洞察を得られるように特別に設計されたオープンソースのSQL AIアシスタントです。自然言語をSQLクエリに変換し、チャート、スプレッドシート、レポートを生成し、多言語での対話をサポートします。この ...

Activepieces:AI工作流程自动化,适合非技术用户的任务编排工具,开源Zapier替代品-首席AI分享圈

Activepieces:AIワークフロー自動化、非技術者向けタスクスケジューリングツール、Zapier代替オープンソース

概要 Activepiecesは、企業や個人ユーザーに直感的で強力な自動化ソリューションを提供することに焦点を当てた、オープンソースのオールインワン自動化ワークフロープラットフォームです。TypeScriptで開発されたこのプラットフォームは非常にスケーラブルで、200以上の統合サービスをサポートしています。このプラットフォームは、AI...

k8m:简化Kubernetes集群管理的轻量级AI控制台工具-首席AI分享圈

k8m: Kubernetesクラスタ管理を簡素化する軽量AIコンソールツール

概要 k8mは、クラスタ管理を簡素化するために設計された、軽量でクロスプラットフォームなMini Kubernetes AI Dashboardです。AMISをベースに構築されており、Kubernetes APIクライアントとしてkomを使用し、組み込みのQwen2.5-Coder-7Bモデルインタラクション機能と、プライベートAIダッシュボードへのアクセスをサポートしています。

SHMT:自监督分层化妆转移模型,虚拟化妆,将妆容迁移到新的人像中-首席AI分享圈

SHMT: Self-Supervised Hierarchical Makeup Transfer Model, バーチャルメイク, 新しいポートレートへのメイクの移行

Synthesis SHMT (Self-supervised Hierarchical Makeup Transfer)は、潜在拡散モデルに基づく自己教師ありの階層的メイクアップ転送プロジェクトであり、教師なし学習法によってメイクアップ効果の高品質な転送を実現することを目的としている。このプロジェクトでは、「デカップリングと再構築」というパラダイムを採用しており、このパラダイムでは、...

VITA:开源视觉与语音实时交互的多模态大语言模型-首席AI分享圈

VITA: リアルタイム視覚・音声インタラクションのためのオープンソース・マルチモーダル大規模言語モデル

概論 VITAは、真の完全なマルチモーダルインタラクションを実現する能力を開拓する、オープンソースの主要な対話型マルチモーダル大規模言語モデリングプロジェクトである。プロジェクトは2024年8月にVITA-1.0を立ち上げ、初のオープンソースの対話型フルモーダル大規模言語モデルの先駆者となりました。

Trend Finder:实时追踪社交媒体趋势、热门话话题和新原文,助力营销决策-首席AI分享圈

Trend Finder: ソーシャルメディアのトレンド、トレンドトピック、新着記事をリアルタイムで追跡し、マーケティングの意思決定に活用。

はじめに Trend Finderは、ソーシャルメディア上のトレンドトピックやトレンドをリアルタイムで追跡できるように設計された強力なツールです。主要なインフルエンサーからの投稿を収集・分析することで、Trend Finderは、新しいトレンドや製品リリースが検出されると、タイムリーにSlack通知を送信することができます。このツールは非常に...

TransRouter:基于Gemini多模态模型,实时中英互译的音频转换工具-首席AI分享圈

TransRouter:Geminiマルチモーダルモデルに基づく中英翻訳用リアルタイム音声変換ツール

TransRouterは、GoogleのGeminiモデルに基づいたリアルタイム音声翻訳ツールで、英語と中国語のリアルタイム音声翻訳用に設計されています。Zoomなどのビデオ会議ソフトにシームレスに統合することができ、クロスリンガルcommunication.TransRoutのリアルタイム翻訳をサポートします。

opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现-首席AI分享圈

opensource_notebooklm: Deepseek-V3とPlayHT TTSに基づくNotebookLMのオープンソース実装

概論 オープンソースNotebookLMは、Deepseek-V3の言語理解能力とPlayHTの音声合成技術を組み合わせた革新的なAIプロジェクトで、インテリジェントなノートテイク対話システムの実現を目指しています。Build Fast with AIチームによって開発されたこのプロジェクトは、テキストコンテンツを...

Open Deep Research:生成基于网络搜索内容的AI研究报告-首席AI分享圈

オープン・ディープ・リサーチ:ウェブ検索コンテンツに基づくAI研究の生成

包括的な紹介 Open Deep Researchは、Google Geminiのディープリサーチ機能に代わるオープンソースのAI駆動型リサーチレポート生成ツールです。TypeScriptで開発され、Next.js 15フレームワーク上に構築されたこのプロジェクトは、Azure Bing Search APIとGoogle Geminiを統合している。

Vision is All You Need:使用视觉语言模型构建智能文档检索系统(Vision RAG)-首席AI分享圈

必要なのは視覚だけ:視覚言語モデルを用いた知的文書検索システムの構築 (Vision RAG)

包括的な紹介 Vision-is-all-you-needは革新的なビジュアルRAG(Retrieval Augmented Generation)システム実証プロジェクトであり、文書処理領域にビジュアル言語モデリング(VLM)を適用する新境地を開くものである。従来のテキストチャンキング手法とは異なり、このシステムでは、視覚言語モデルを直接使用してPDFファイルのページを処理する...

ja日本語