AIパーソナル・ラーニング
と実践的なガイダンス
サイバーナイフ用ドローイングミラー
合計1020記事

タグ: AIのオープンソースプロジェクト 31ページ

Audiblez:生成有声书,使用Kokoro将电子书转换为有声读物-首席AI分享圈

Audiblez: ココロでオーディオブックを作成、電子書籍をオーディオブックに変換

概要 Audiblezは、電子書籍(.epub形式など)をオーディオブック(.m4b形式など)に変換するためのオープンソースプロジェクトです。このプロジェクトでは、Kokoroの高品質音声合成技術を利用して、複数の言語と音声をサポートしています。ユーザーは、簡単なコマンドラインで電子ブックを変換できます。

Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识-首席AI分享圈

検索 o1: 推論モデルに能動的な検索機能を与え、大規模モデルが思考しながら外部の知識を検索できるようにする。

包括的な紹介 Search-o1は、高度な検索メカニズムを統合することで、大規模推論モデル(LRM)のパフォーマンスを向上させることを目的としたオープンソースプロジェクトである。コアとなるアイデアは、動的な検索と知識の統合を通じて、推論プロセスで遭遇する知識不足の問題を解決することです。このプロジェクトは、sunnynexusチームによって開発されています。

ラマ3.2推論WebGPU:ブラウザでラマ3.2を動かす

一般的な紹介 Transformers.jsはHugging Faceが提供するJavaScriptライブラリで、最先端の機械学習モデルをサーバーのサポートなしにブラウザ上で直接実行できるように設計されている。このライブラリはHugging FaceのPython用transformersライブラリと同等であり、様々なプリ...

MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布-首席AI分享圈

MoneyPrinter V2:短いYouTube動画とTwitterコンテンツを自動生成し、公開する

一般的な紹介 MoneyPrinter V2はFujiwaraChokiによって開発されたオープンソースプロジェクトです。このプロジェクトは主にTwitter自動化、YouTubeショートビデオ生成、アフィリエイトマーケティングなどの機能を統合しています。ユーザはPythonスクリプトを使ってコンテンツ...

RTranslator:语音实时翻译安卓应用,免费且支持离线使用-首席AI分享圈

RTranslator: Android用リアルタイム音声翻訳アプリ!

一般的な紹介 RTranslatorは、Androidデバイス用に設計されたほぼオープンソースの無料オフラインリアルタイム翻訳アプリです。ユーザーはBluetoothヘッドセットを接続することで、携帯電話をポケットに入れたまま、まるで自分の言語を話しているかのように他の人と会話をすることができます。RTranslatorは、対話を含む複数のモードをサポートしています...

Gemini Next Chat:一键免费部署您的私人多模态Gemini应用-首席AI分享圈

Gemini Next Chat: ワンクリックで、プライベートなマルチモーダルGeminiアプリを無料でデプロイできます!

一般的な紹介 Gemini Next Chatは、ユーザーがプライベートGeminiアプリケーションを簡単にデプロイできるように設計されたオープンソースプロジェクトです。このプロジェクトは、Gemini 1.5とGemini 2.0のマルチモーダルモデルをサポートしており、ユーザーはVercel上でワンクリックするだけで無料でデプロイすることができます。

AutoMouser:マウスアクションをAI経由でSelenium Pythonスクリプトに変換するブラウザ自動化コードの生成

概要 AutoMouserは、ユーザーのインタラクションをインテリジェントに追跡し、OpenAIのGPTモデルを使用してSeleniumテストコードを自動的に生成するChrome拡張機能です。ユーザーのブラウザ操作を記録し、堅牢でメンテナンス可能なPython Seleniumスクリプトに変換します。

Vanna:利用RAG技术将文本生成精准SQL查询-首席AI分享圈

Vanna: RAG技術を使ったテキストからの正確なSQLクエリの生成

一般的な紹介 VannaはMITライセンスのオープンソースPythonフレームワークで、RAG(Retrieval Augmented Generation)技術を使ってSQLクエリを生成することに重点を置いている。ユーザはRAGモデルを訓練し、自分のデータに適用し、質問をすると、Vannaは適切なSQLクエリを返す。これらのクエリは自動的に...

SVFR:实现视频人脸修复的统一框架,修复黑白、模糊的人像老视频-首席AI分享圈

SVFR:ビデオ顔修復を実装する統一フレームワーク、白黒、ぼやけたポートレート古いビデオの修復

包括的な紹介 SVFR(Stable Video Face Restoration)は、基本顔復元(Basic Face Restoration: BFR)、色付け、修復、およびそれらの組み合わせタスクをサポートする、ビデオ顔復元のための統一フレームワークである。このフレームワークは、生成と動きのアプリオリを利用し、統一的な顔復元フレームワークを通してタスク固有の情報を統合し、...

LiveTalking:开源实时互动数字人直播系统,实现音视频同步对话-首席AI分享圈

LiveTalking: オープンソースのリアルタイム・インタラクティブ・デジタル・ヒューマン・ライブ・システム。

包括的な紹介 LiveTalkingはオープンソースのリアルタイムインタラクティブデジタルヒューマンシステムで、高品質のデジタルヒューマンライブソリューションの構築に取り組んでいます。このプロジェクトは、Apache 2.0オープンソースプロトコルを使用し、ER-NeRFレンダリング、リアルタイムオーディオおよびビデオストリーム処理、リップシンクロナイゼーションなど、数多くの最先端技術を統合しています。このシステムは、リアル ...

Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑-首席AI分享圈

Aider: オープンソースのプログラミングアシスタントツール。

一般的な紹介 Aiderは、開発者が自然言語対話を通してコードを書いたり、編集したり、リファクタリングしたりするのを助ける、強力なオープンソースのAIプログラミングアシスタントツールです。対話型AIペアプログラミングツールとして、Aiderは多くの主要なプログラミング言語をサポートし、Gitワークフローにシームレスに統合し、...

JoyGen:音频驱动的3D深度感知人像说话视频编辑工具-首席AI分享圈

ジョイジェン:音声駆動型3D奥行き認識型トーキングビデオ編集ツール

包括的な紹介 JoyGenは、音声による表情生成の問題を解決することに重点を置いた、話す顔のための革新的な2段階映像生成フレームワークである。Jingdong Technologyのチームによって開発されたこのフレームワークは、高度な3D再構成技術と音声特徴抽出法を用いて、話者のアイデンティティ特徴と表情係数を正確にキャプチャします。

VSR:AI技术无损去除视频水印和硬字幕软件(视频去水印客户端7G+)-首席AI分享圈

VSR:AI技術によるロスレスビデオ透かし除去及びハード字幕ソフトウェア(ビデオ透かし除去クライアント7G+)

包括的な紹介 ビデオ字幕リムーバー(Video-subtitle-remover、略してVSR)は、AI技術に基づくビデオ処理ソフトウェアで、ビデオからハード字幕やテキストウォーターマークを削除するために特別に設計されています。このツールは、インテリジェントに識別するために、様々なAIアルゴリズムモデル(STTN、LAMA、PROPAINTER)を使用しています...

TimesFM 2.0:谷歌开源进行时间序列预测的预训练模型-首席AI分享圈

TimesFM 2.0:グーグルが時系列予測のための事前学習済みモデルをオープンソース化

包括的な紹介 TimesFM 2.0 - 500M PyTorchは、Google Researchによって開発され、時系列予測用に設計された事前学習済みの時系列ベースモデルです。TimesFM 2.0は、時系列予測用に開発された事前学習済みの時系列ベースモデルで、最大2048ポイントの時系列を扱うことができ、任意の予測範囲をサポートします。

微信视频号下载器:快速下载微信视频号视频,支持多种格式和平台-首席AI分享圈

WeChat動画番号ダウンローダー:WeChat動画番号の動画を素早くダウンロード、複数のフォーマットとプラットフォームをサポートする

総合紹介 WeChat動画番号ダウンローダーはオープンソースプロジェクトで、ユーザーがWeChat動画番号から動画コンテンツを素早くダウンロードできるように設計されています。このツールは、様々なビデオフォーマットとプラットフォームをサポートしており、ユーザーはWindowsとmacOSシステム上で簡単に使用することができます。このプロジェクトはltaooによって開発され、GitHubでホストされています。

Riona-AI-Agent:社交媒体自动化互动智能体,自动搜索、点赞、留言-首席AI分享圈

Riona-AI-Agent: 自動的に検索、いいね!、メッセージを残すソーシャルメディア自動対話型インテリジェンス

概要 Riona-AI-Agent は、主要なソーシャルメディア・プラットフォームの運用を管理・最適化するために特別に設計された、AI を活用した革新的な自動化ツールです。高度な AI モデルを活用し、Instagram、Twitter、GitHub などのプラットフォームにインテリジェントなコンテンツ生成とアカウント管理機能を提供します。このシステムは...

NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本-首席AI分享圈

NVインジェスト:複雑なフォーマットのドキュメントを解析し、マルチモーダルデータをメタデータとテキストに抽出する。

包括的な紹介 NV Ingest (NVIDIA Ingest)は、何十万もの複雑で厄介な非構造化PDFやその他の企業ドキュメントを解析するために設計された、アーリーアクセスのマイクロサービス群です。NVIDIA Ingestは、これらのドキュメントをメタデータとテキストに変換し、検索システムに埋め込むことができます。

「常時稼働のDeepseek AIアシスタント:Deepseek-V3に基づくインテリジェントな音声対話システムの構築

包括的な紹介 Always-On AI Assistantは、Deepseek-V3、RealtimeSTT、Typerなどの先進技術を統合し、強力で永続的なオンラインAIアシスタントシステムを作成する革新的なAIアシスタントプロジェクトです。このプロジェクトは、特にエンジニアリング開発シナリオに最適化されており、完全な...

STAR:空间时序增强AI模型,提升视频分辨率清晰度-首席AI分享圈

STAR:映像解像度の鮮明度を向上させる空間タイミング拡張AIモデル

総合紹介 STAR(Spatial-Temporal Augmentation with Text-to-Video Models)は、南京大学、ByteDance、西南大学によって共同開発された革新的な映像超解像フレームワークである。このプロジェクトは、実世界の動画超解像処理における重要な問題を解決するために...

ja日本語