AI Personal Learning
und praktische Anleitung
TRAE
Insgesamt 1020 Artikel

Tags: KI Open-Source-Projekte Seite 47

Ortlin:与所有OpenAI模型和API交互的Web图形用户界面-首席AI分享圈

Ortlin: eine Web-GUI für die Interaktion mit allen OpenAI-Modellen und APIs

Allgemeine Einführung Ortlin ist eine webbasierte grafische Benutzeroberfläche, die sowohl technischen als auch nicht-technischen Benutzern die einfache Interaktion mit den APIs und den zugrunde liegenden Modellen von OpenAI ermöglicht. Es ist völlig kostenlos und quelloffen, so dass Benutzer die Leistungsfähigkeit von OpenAI ohne Probleme nutzen können...

AigoTools:自动收录网站并支持多语言的开源AI工具导航站-首席AI分享圈

AigoTools: automatische Aufnahme von Websites und Unterstützung für mehrsprachige Open-Source-KI-Tool-Navigationsseiten

Umfassende Einführung AigoTools ist ein Open-Source-KI-Website-Navigation, entwickelt, um Benutzern zu helfen, schnell zu erstellen und zu verwalten Navigation Websites. Es verfügt über integrierte Website-Management und AI-basierte Auto-Inclusion-Funktionen , Unterstützung für mehrere Sprachen , dunkel / hell Thema Umstellung und SEO-Optimierung.AigoTools bietet eine Vielzahl von Bildspeicherlösungen , einschließlich dieser ...

GPT4Free:反编译AI对话网站接口,免费使用多种GPT模型-首席AI分享圈

GPT4Free: Dekompilierung der AI-Dialog-Website-Schnittstelle zur freien Nutzung mehrerer GPT-Modelle

Allgemeine Einführung GPT4Free ist ein Open-Source-Projekt, das vom Entwickler xtekky auf GitHub veröffentlicht wurde. Es zielt darauf ab, eine Vielzahl von leistungsstarken Sprachmodellen kostenlos zur Verfügung zu stellen, darunter GPT-3.5, GPT-4, Llama, Gemini-Pro, Bard und Claude. Das Projekt, das mehrere API-Anfragen aggregiert, bietet sup...

Amphion MaskGCT:零样本文本到语音克隆模型(本地一键部署包)-首席AI分享圈

Amphion MaskGCT: Null-Sample Text-zu-Sprache-Klonmodell (lokales Ein-Klick-Bereitstellungspaket)

Umfassende Einführung MaskGCT (Masked Generative Codec Transformer) ist ein vollständig nicht-autoregressives Text-to-Speech (TTS)-Modell, das gemeinsam von Funky Maru Technology und der Chinese University of Hong Kong entwickelt wurde. Das Modell macht explizite Text-zu-Sprache-Ausrichtungsinformationen überflüssig und verwendet einen zweistufigen Generierungsansatz, zunächst durch ...

Quanta Quest:端侧大模型与面向个人数据的本地化AI搜索平台(预览版)-首席AI分享圈

Quanta Quest: große Modelle auf der Endseite und lokalisierte KI-Suchplattform für persönliche Daten (Vorschau)

Einführung Quanta Quest ist das weltweit erste Produkt, das "end-side big model + C-side data localisation" als seine zentrale Entwicklungsrichtung nimmt. Es hilft Benutzern, alle Daten von Gmail, Notion, Dropbox, etc. lokal zu speichern und die Sicherheit und den Datenschutz durch Vektordatenbankverarbeitung zu gewährleisten. Es hilft Benutzern, alle Daten von Gmail, Notion, Dropbox, etc. lokal zu speichern und sie durch Vektordatenbankverarbeitung zu verarbeiten, um die Datensicherheit und den Datenschutz zu gewährleisten...

PDF in Podcast: Dienstprogramm zum Konvertieren von PDF in Podcast

Allgemeine Einführung Inspiriert von den Podcast-Erzeugungsfunktionen von Notebook LM und der aktuellen Open-Source-Implementierung von Open Notebook LM. In diesem Rezept werden wir eine detaillierte Schritt-für-Schritt-Anleitung implementieren, wie man eine PDF-zu-Podcast-Pipeline erstellt. Aus einer beliebigen PDF-Datei wird ein Segment generiert, in dem der Moderator und die Gäste diskutieren und erklären ...

Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现-首席AI分享圈

Agent.exe: Lassen Sie die KI Ihren Computer direkt steuern, eine Open-Source-Implementierung von Claudes Kontrollcomputer

Allgemeine Einführung Agent.exe ist eine Open-Source-Electron-Anwendung, die die Claude 3.5 Sonnet-API von Anthropic nutzt, um Benutzern die direkte Steuerung ihres lokalen Computers durch KI zu ermöglichen. Das von Kyle Corbitt entwickelte Projekt zielt darauf ab, eine leichtgewichtige Lösung zu bieten, die es dem Benutzer erlaubt,...

MindSearch:开源AI搜索引擎框架,部署您自己的 Perplexity 搜索引擎!-首席AI分享圈

MindSearch: Open-Source-KI-Suchmaschinen-Framework zum Einsatz Ihrer eigenen Perplexity-Suchmaschine!

Umfassende Einführung MindSearch ist ein Open-Source-KI-Suchmaschinen-Framework, das vom Shanghai Artificial Intelligence Laboratory (SAL) ins Leben gerufen wurde und darauf abzielt, den menschlichen Denkprozess für komplexe Informationsbeschaffung und -integration zu simulieren. Das Tool kombiniert die fortschrittliche Technologie der groß angelegten Sprachmodellierung (LLM) und Suchmaschine mit einem Multi-Intelligenz-Framework, um die...

CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签-首席AI分享圈

CosyVoice: Open-Source-Projekt zum Klonen von 3-Sekunden-Stimmen von Ali mit Unterstützung für gefühlsgesteuerte Tags

Umfassende Einführung CosyVoice ist ein mehrsprachiges, groß angelegtes Spracherzeugungsmodell, das von der Inferenz über das Training bis hin zum Einsatz umfassende Funktionen bietet. Es wurde vom FunAudioLLM-Team entwickelt und zielt darauf ab, eine qualitativ hochwertige Sprachsynthese durch fortschrittliche autoregressive Transformatoren und ODE-basierte Diffusionsmodelle zu erreichen....

Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务-首席AI分享圈

Fabric: ein KI-Open-Source-Workflow-Framework, das viele Stichworte zur effizienten Bearbeitung einer Vielzahl von Transaktionen integriert

Allgemeine Einführung Fabric ist ein Open-Source-KI-Framework, das von Daniel Miessler entwickelt wurde, um alltägliche Computeraufgaben zu vereinfachen und zu automatisieren und künstliche Intelligenz leichter nutzbar zu machen. Es hilft Benutzern, eine Vielzahl von Aufgaben wie Inhaltszusammenfassung und Datenextraktion durch modularen Aufbau und vordefinierte Eingabeaufforderungen (Patterns) effizient zu erledigen...

NocoDB:在多种数据库上创建智能表格,开源Airtable替代方案-首席AI分享圈

NocoDB: Erstellen von Smart Tables in mehreren Datenbanken, Open Source Airtable Alternative

Allgemeine Einführung NocoDB ist eine Open-Source-Alternative zu Airtable, die ein leistungsfähiges und einfach zu bedienendes Online-Datenbankmanagement-Tool darstellt. Mit NocoDB können Benutzer auf einfache Weise Daten aus Datenbanken erstellen, lesen, aktualisieren und löschen, ohne Code schreiben zu müssen. Die Plattform unterstützt eine breite Palette von Datenbanktypen,...

TANGO:语音生成协调手势人像视频的工具,全身像数字人-首席AI分享圈

TANGO: ein Werkzeug für sprachgenerierte koordinierte Gestenportraits eines digitalen Ganzkörpermenschen

Allgemeine Einführung TANGO (Co-Speech Gesture Video Reenactment with Hierarchical Audio-Motion Embedding and Diffusion Interpolation) ist ein von der Universität Tokio und CyberAgent AI Labs entwickeltes Open-Source-Framework zur kollaborativen Erzeugung von Sprach-Gesten-Videos Ein von der Universität Tokio und CyberAgent AI Lab gemeinsam entwickeltes Open-Source-Framework zur kollaborativen Erzeugung von Sprachgestenvideos. Die ...

Behebt ungültige JSON-Zeichenfolgen und behebt mögliche Formatierungsfehler in von LLMs generierten JSON-Daten.

Allgemeine Beschreibung Ein Modul zur Korrektur ungültiger JSON-Dateien, insbesondere zum Parsen falscher JSON-Daten, die von Large Language Models (LLMs) ausgegeben werden. Das Modul kann häufige JSON-Syntaxfehler wie fehlende Anführungszeichen, falsche Kommas, nicht abgeschriebene Zeichen und unvollständige Schlüssel-Wert-Paare beheben. Es kann auch selbst...

Kolors Virtual Try On:高效的虚拟试穿/模特换装,文本到图像生成模型-首席AI分享圈

Kolors Virtual Try On: Effiziente virtuelle Anprobe/Model Dressing, Text-to-Image Generation Modelle

Allgemeine Einführung Kolors Virtual Try-On ist eine virtuelle Anprobe-App des Kwai-Kolors-Teams auf der Hugging Face-Plattform. Die App nutzt fortschrittliche Technologie der künstlichen Intelligenz, um den Nutzern zu helfen, verschiedene Farben von Kleidung in einer virtuellen Umgebung anzuprobieren, um die beste Passform für sie zu finden. Mit...

Pyramid Flow:快手推出的开源版

Pyramid Flow: eine von Racer eingeführte Open-Source-Version von "Kringle", die auf SD3 basiert und auf Grafikprozessoren mit weniger als 8 GB läuft (Version mit Ein-Klick-Bereitstellung)

Allgemeine Einführung Pyramid Flow ist ein effizientes autoregressives Verfahren zur Videogenerierung, das auf der Flow-Matching-Technik basiert. Die Methode ermöglicht die Generierung und Dekomprimierung von Videoinhalten mit höherer Recheneffizienz durch Interpolation zwischen verschiedenen Auflösungen und Rauschpegeln....

Dify:生成式AI应用开发平台,可视化编排, 支持私有化部署-首席AI分享圈

Dify: Generative KI-Anwendungsentwicklungsplattform, visuelle Orchestrierung, Unterstützung bei der privaten Bereitstellung

Umfassende Einführung Dify ist eine Open-Source-Plattform für die Entwicklung generativer KI-Anwendungen, die Entwicklern helfen soll, schnell native KI-Anwendungen auf der Grundlage von Large Language Models (LLMs) zu erstellen und zu betreiben. Die Plattform bietet eine Vielzahl von Funktionen von der Agentenkonstruktion bis zur KI-Workflow-Orchestrierung, RAG-Abruf, Modellmanagement usw., die die Entwicklung von...

Datalab:专用OCR识别AI模型,PDF转Markdown(开源/API)-首席AI分享圈

Datalab: spezielles KI-Modell für OCR-Erkennung, PDF zu Markdown (Open Source/API)

Umfassende Einführung Datalab bietet eine Reihe von fortschrittlichen KI-Modellen mit Schwerpunkt auf OCR, Layout-Analyse, PDF zu Markdown und mehr. Diese Modelle sind nicht nur sehr leistungsfähig, sondern auch einfach zu bedienen und quelloffen. Die Marker-Modelle auf der Plattform können PDF schnell und präzise in Markdown konvertieren, einschließlich Tabellen...

ModelBest(面壁智能):全球领先的轻量高性能端侧大模型-首席AI分享圈

ModelBest: Das weltweit führende leichtgewichtige, leistungsstarke End-Side Big Model

Allgemeine Einführung ModelBest ist ein Unternehmen, das sich auf die Entwicklung von leichtgewichtigen und leistungsstarken Großmodellen konzentriert, um fortschrittliche KI-Technologien auf Mainstream-Unterhaltungselektronik und verschiedene Endgeräte des täglichen Lebens anzuwenden. Seine MiniCPM-Serie von Endseitenmodellen ist bekannt für ihre extreme Rechenleistung und Speichernutzungseffizienz, die geringe Anzahl von Parametern,...

de_DEDeutsch