AIパーソナル・ラーニング
と実践的なガイダンス
TRAE
合計1020記事

タグ: AIのオープンソースプロジェクト 20ページ

Memobase:为AI应用提供基于用户画像的长期记忆方案-首席AI分享圈

メモベース:AIアプリケーションのためのユーザープロファイルに基づく長期記憶ソリューション

一般的な紹介 Memobaseは、生成的なAIアプリケーションのための長期的なユーザー記憶をサポートするように設計された、ユーザープロファイルに基づく記憶システムです。バーチャルコンパニオン、教育ツール、パーソナライズされたアシスタントのいずれを構築する場合でも、Memobaseは、AIがユーザーのインタラクションを記憶し、理解し、進化するのを支援します。を通じて...

agent-twitter-client:无需Twitter API密钥,发送、转发推文-首席AI分享圈

agent-twitter-client: Twitter APIキーなしでツイートを送信、リツイートする。

概要 agent-twitter-client は、Twitter API キーなしで動作する Twitter クライアントです。このプロジェクトは、@the-convocation/twitter-scraperをベースに、ツイートやリツイートを送信する機能を追加したものです。ブラウザとサーバーの両方で動作し、...

中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集-首席AI分享圈

中国ベースの全血DeepSeek-R1蒸留データセット、中国R1蒸留SFTデータセットをサポート

包括的な紹介 中国語のDeepSeek-R1蒸留データセットは、機械学習と自然言語処理の研究を支援するために設計された、110Kのデータ項目を含むオープンソースの中国語データセットである。このデータセットはCong LiuのNLPチームによって公開されている。 このデータセットには数学的データだけでなく、論理的推論などの一般的なデータも多数含まれている。

MoBA: Kimi 推出的支持长上下文处理的大语言模型-首席AI分享圈

MoBA:長い文脈処理のためのキミの大規模言語モデル

包括的な紹介 MoBA(Mixture of Block Attention)は、MoonshotAIによって開発された革新的なアテンションメカニズムで、長い文脈処理を行う大規模言語モデル(LLM)向けに設計されています。MoBAは、文脈全体を複数のブロックに分割し、各クエリトークンで最も関連性の高いKVブロックにアテンションするように学習します。

Base Chat:基于 Ragie 构建知识库的多租户聊天机器人-首席AI分享圈

Base Chat: Ragieに基づく知識ベース構築のためのマルチテナント型チャットボット

一般的な紹介 Base Chat は、Ragie Connect を使用して組織のナレッジベースに接続し、会話するマルチテナント型チャットボットです。このプロジェクトは、いくつかのRagie機能のリファレンスアプリケーションであり、Google AuthenticationをサポートするNext.jsで構築されています。Base Chatは、チャットマシンを通してユーザーを支援するように設計されています。

AIBot PRO:集成多种AI产品的商业化聚合平台-首席AI分享圈

AIBot PRO:複数のAI製品を統合した商品化アグリゲーション・プラットフォーム

総合紹介 AIBot PROは、複数のAI製品を統合するための便利なプラットフォームをユーザーに提供するために設計された.NET 6ベースのAI集約クライアントです。このクライアントは、無感覚な切り替え対話をサポートし、ChatGPT、Gemini、Claude、Wenxin Yiyin、Tongyi Qianqian、Xunfei Starfire.AIBotなどの複数のAI製品を統合します。

ColossalAI:提供高效大规模AI模型训练解决方案-首席AI分享圈

ColossalAI: 効率的な大規模AIモデル学習ソリューションの提供

包括的な紹介 ColossalAIは、HPC-AI Technologies社によって開発されたオープンソースプラットフォームで、大規模なAIモデルの学習と推論に効率的でコスト効率の高いソリューションを提供します。複数の並列戦略、ヘテロジニアスメモリ管理、混合精度学習をサポートすることで、ColossalAIはモデルの学習と推論を大幅に削減することができます...

HealthGPT:支持医学图像分析与诊断问答的医疗大模型-首席AI分享圈

HealthGPT:医療画像解析と診断Q&Aを支援する医療ビッグモデル

包括的な紹介 HealthGPTは、異種知識適応による統一的な医療視覚理解と生成能力の達成を目指す、先進的な医療グランドビジュアル言語モデルである。このプロジェクトの目標は、医療画像処理を大幅に改善する統一的な自己回帰フレームワークに医療視覚理解と生成能力を統合することである...

MatAnyone: 提取视频指定目标人像的开源工具,生成目标人像视频-首席AI分享圈

MatAnyone: ターゲットポートレート指定ビデオ抽出、ターゲットポートレートビデオ生成オープンソースツール

一般的な紹介 MatAnyoneは、シンガポールの南洋理工大学S-Labの研究チームによって開発され、GitHubで公開されているビデオキーイングに焦点を当てたオープンソースプロジェクトです。一貫したメモリ伝搬技術により、安定した効率的なビデオ処理能力をユーザーに提供し、特に複雑な背景を扱うのに優れています。

HiveChat:适合公司内部快速部署的AI聊天机器人-首席AI分享圈

HiveChat:企業内で迅速に展開できるAIチャットボット

はじめに HiveChatは中小規模のチーム向けのAIチャットボットで、管理者は複数のAIモデル(Deepseek、OpenAI、Claude、Geminiなど)を一度に設定し、チームメンバーが簡単に使用できるようにすることができます。LaTeXとMarkdownレンダリング、DeepS...

Omnitool:AI爱好者工具箱,在一个桌面中管理、连接并使用所有AI模型-首席AI分享圈

Omnitool:すべてのAIモデルを1つのデスクトップで管理、接続、使用できるAI愛好家のツールボックス!

一般的なOmnitool.aiは、学習者、趣味愛好家、および現在のAI技術革新に興味がある人のための拡張可能なブラウザベースのデスクトップ環境を提供するように設計されたオープンソースの "AIラボ "です。Omnitool.iは、OpenAI、replicate.com、Stable Diffusio...などの他のAIラボとのコラボレーションを可能にします。

Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型-首席AI分享圈

Step-Video-T2V:多言語入力とロングビデオ生成をサポートするVincennesビデオモデル

総合紹介 Step-Video-T2VはStepFun AI (StepFun Star)による先進的なテキストから動画への変換モデルです。このモデルは30億のパラメータを持ち、最大204fpsの動画を生成することができます。VAE(可変オートエンコーダ)により、16x16の空間圧縮と8xの時間圧縮を実現しています。

OmniParser:用户界面截图解析成结构化元素,便于大模型理解和操作-首席AI分享圈

OmniParser: ユーザーインターフェースのスクリーンショットを構造化された要素に解析し、大規模なモデルの理解と操作を容易にします。

一般的な紹介 OmniParserは、ユーザーインターフェースのスクリーンショットを構造化された理解しやすい要素に解析するためにMicrosoftによって開発されたツールです。このツールは、GPT-4Vが対応するインターフェイス領域で正確なアクションを生成する能力を大幅に向上させます。OmniParserは、幅広い大規模な言語モデルをサポートするだけでなく、...

Genspark2api (失敗)

一般的な紹介 genspark2apiはGitHubでホストされているオープンソースのAPIサービスツールで、開発者のdeanxvによって作成されました。マルチモデルダイアログ、テキストからグラフ、テキストからビデオをサポートするインターフェースサービスを提供し、ユーザはローカルまたはDocker経由でサーバに素早くデプロイすることができます。この作品は...

DragAnything:对图像中实体对象控制运动硅基生成视频-首席AI分享圈

DragAnything: 画像内の固形オブジェクトのためのシリコンベースのビデオ生成モーションの制御

一般的な紹介 DragAnythingは、エンティティ表現によって任意のオブジェクトのモーションコントロールを実現することを目的としたオープンソースプロジェクトです。このプロジェクトはShowlabチームによって開発され、ECCV2024に採択されました。DragAnythingは、ユーザが軌跡線を描くだけの、ユーザフレンドリーなインタラクションを提供します。

Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能-首席AI分享圈

Step-Audio:マルチモーダル音声インタラクションフレームワーク。

包括的な紹介 Step-Audioはオープンソースのインテリジェント音声対話フレームワークです。このフレームワークは、多言語会話(例:中国語、英語、日本語)、感情音声(例:嬉しい、悲しい)、地域方言(例:広東語、四川語)をサポートし、...

Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像-首席AI分享圈

透かし除去:オープンソース画像透かし除去ツール、画像透かし復元オリジナル画像

一般的な紹介 電子透かし除去は、機械学習とディープラーニング技術を画像修復に使用するオープンソースプロジェクトであり、特に画像から電子透かしを除去するためのものである。このプロジェクトはChimzuruoke Okaforによって開発され、Contextual AttentionとGated Convolutionにインスパイアされています。

FoloUp:开源AI语音面试平台,生成定制面试题并进行智能分析-首席AI分享圈

FoloUp:カスタム面接質問を生成し、インテリジェントな分析を実行するオープンソースAI音声面接プラットフォーム

概論 FoloUpは、企業向けにAIを活用した音声面接ソリューションを提供するために設計されたオープンソースのプラットフォームです。FoloUpを利用することで、企業は職務内容に合わせてカスタマイズした面接質問を素早く作成し、AIによる自然な会話形式の面接を実施することができます。このプラットフォームはまた、詳細な面接分析とスコアリングを提供し、企業を支援します...

ja日本語