AI Personal Learning
und praktische Anleitung
TRAE
Insgesamt 992 Artikel

Tags: KI Open-Source-Projekte Seite 7

MoshiVis:实时语音对话和图像理解的开源模型-首席AI分享圈

MoshiVis: ein Open-Source-Modell für Sprachdialog und Bildverständnis in Echtzeit

Allgemeine Einführung MoshiVis ist ein Open-Source-Projekt, das von Kyutai Labs entwickelt und auf GitHub gehostet wird. Es basiert auf dem Moshi-Sprache-zu-Text-Modell (7B-Parameter), mit etwa 206 Millionen neuen Anpassungsparametern und einem eingefrorenen PaliGemma2-Visual-Coder (400M-Parameter), der es dem Modell ermöglicht, Echtzeit-Sprache zu verwenden...

MiniMind:2小时从零训练26M参数GPT的开源工具-首席AI分享圈

MiniMind: 2 Stunden Training von Grund auf 26M Parameter GPT Open Source Tool

MiniMind ist ein Open-Source-Projekt, das vom Entwickler jingyaogong entwickelt wurde. Das Hauptziel von MiniMind ist es, normalen Menschen die Möglichkeit zu geben, schnell ihre eigenen KI-Modelle zu trainieren. Das Hauptmerkmal von MiniMind ist, dass es 2 Stunden dauert, um ein GPT-Modell mit 26 Millionen Parametern von Grund auf auf einer einzigen NVIDIA 3090-Grafikkarte zu trainieren. ....

AI-ClothingTryOn:基于 Gemini 的虚拟服装试穿工具-首席AI分享圈

AI-ClothingTryOn: Zwillingsbasiertes Tool zur virtuellen Anprobe von Kleidung

Allgemeine Einführung AI-ClothingTryOn ist eine Python-basierte Open-Source-Desktop-Anwendung, die vom Entwickler speedTD erstellt und auf GitHub gehostet wird. Sie nutzt die Technologie der künstlichen Intelligenz von Google Gemini, um es Nutzern zu ermöglichen, Fotos von Personen und Bildern von Kleidung hochzuladen, um virtuelle Anprobeeffekte zu erzeugen. Benutzer können...

OpenDeepSearch:支持智能推理的开源搜索工具-首席AI分享圈

OpenDeepSearch: ein Open-Source-Suchwerkzeug, das intelligente Schlussfolgerungen unterstützt

Allgemeine Einführung OpenDeepSearch ist ein Open-Source-Suchwerkzeug, das vom sentient-agi-Team entwickelt wurde. Es kombiniert Large Language Modelling (LLM) und Intelligent Reasoning Agents, um Nutzern die Möglichkeit zu geben, im Web nach Informationen zu suchen und auf einfache Weise genaue Antworten zu erhalten. Das Ziel dieses Tools ist es, die Suche offener zu gestalten...

Vibe Draw:将手绘草图转化为3D模型的创意工具-首席AI分享圈

Vibe Draw: ein kreatives Werkzeug, um handgezeichnete Skizzen in 3D-Modelle zu verwandeln

Allgemeine Einführung Vibe Draw ist ein von Martin Sit entwickeltes Open-Source-Projekt, mit dem Benutzer handgezeichnete Skizzen in wunderschöne 3D-Modelle verwandeln können. Das Ziel dieses Tools ist einfach: Es soll es für jeden einfach machen, 3D-Modelle zu erstellen, ohne dass große künstlerische Fähigkeiten oder komplexe Software erforderlich sind. Es nutzt die Technologie der künstlichen Intelligenz...

FlowGram.AI:快速创建节点式工作流的开源引擎-首席AI分享圈

FlowGram.AI: Eine Open-Source-Engine zur schnellen Erstellung nodaler Workflows

Umfassende Einführung Flowgram.ai ist eine von ByteDance entwickelte Open-Source-Engine zur Erstellung von Prozessen. Es basiert auf der Bearbeitung von Knoten, um Entwicklern zu helfen, schnell Workflows zu erstellen, Unterstützung für festes Layout und freie Verknüpfung zwei Modi. Das Projekt ist in TypeScript geschrieben, der Code ist auf GitHub gehostet, quelloffen und frei...

Qwen2.5-Omni:多模态输入和实时语音交互的端测模型-首席AI分享圈

Qwen2.5-Omni: ein Endmessungsmodell für multimodale Eingabe und Sprachinteraktion in Echtzeit

Umfassende Einführung Qwen2.5-Omni ist ein Open-Source-Modell für multimodale KI, das vom Alibaba Cloud Qwen-Team entwickelt wurde. Es kann mehrere Eingaben wie Text, Bilder, Audio und Video verarbeiten und Antworten in Text oder natürlicher Sprache in Echtzeit erzeugen. Das Modell wurde am 26. März 2025 veröffentlicht, und der Code und die Modelldateien sind...

Dify-Plus:为Dify开发的企业内部管理后台-首席AI分享圈

Dify-Plus: ein lokales Management-Backend für Dify

Umfassende Einführung Dify-Plus ist eine KI-Anwendungsentwicklungsplattform, die auf der Sekundärentwicklung des Open-Source-Projekts Dify basiert. Sie fügt ein neues, auf Dify basierendes Verwaltungszentrum hinzu und optimiert die Funktionalität für Unternehmensszenarien. Das Projekt war zunächst für den unternehmensinternen Gebrauch, und später festgestellt, dass die Gemeinschaft hat ähnliche Bedürfnisse, dann Open-Source-Sharing.Dify-Plus...

Rankify:支持信息检索与重排序的Python工具包-首席AI分享圈

Rankify: ein Python-Toolkit, das die Suche und Neuordnung von Informationen unterstützt

Allgemeine Einführung Rankify ist ein Open-Source-Python-Toolkit, das von der Data Science Group an der Universität Innsbruck entwickelt wurde. Es konzentriert sich auf Information Retrieval, Reordering und Retrieval Augmentation Generation (RAG) und bietet ein einheitliches Framework. Das Toolkit wird mit 40 vorbereiteten Benchmark-Datensätzen geliefert und unterstützt 7 Retrieval-Techniken...

CFG-Zero-star:提升图像和视频生成质量的开源工具-首席AI分享圈

CFG-Zero-star: ein Open-Source-Tool zur Verbesserung der Qualität der Bild- und Videoerzeugung

Allgemeine Einführung CFG-Zero-star ist ein Open-Source-Projekt, das von Weichen Fan und dem S-Lab-Team der Technologischen Universität Nanyang entwickelt wurde. Es konzentriert sich auf die Verbesserung der Classifier Free Guidance (CFG)-Technik in Stream-Matching-Modellen, um die Qualität der Bild- und Videoerzeugung durch die Optimierung der Guidance-Strategie und der Null-Initialisierungsmethoden zu verbessern....

Bonsai:适合边缘设备运行的三值权重语言模型-首席AI分享圈

Bonsai: Ein dreiwertiges gewichtetes Sprachmodell, das für den Einsatz auf Randgeräten geeignet ist

Allgemeine Einführung Bonsai ist ein von deepgrove-ai entwickeltes Open-Source-Sprachmodell mit einer Parametergröße von 500 Millionen, das ternäre Gewichte verwendet. Es basiert auf der Llama-Architektur und dem Mistral-Klassifikator, mit linearen Schichten, die zur Unterstützung ternärer Gewichte angepasst wurden. Das Modell verwendet hauptsächlich DCLM...

de_DEDeutsch