🚀 Einladung zum Erleben: Chinas erste KI-IDE Intelligente Programmiersoftware Trae Chinesische Version downloadDer DeepSeek-R1 und Doubao-pro sind unbegrenzt verfügbar!

Insgesamt 1020 Artikel

Tags: KI Open-Source-Projekte Seite 31

Audiblez：生成有声书，使用Kokoro将电子书转换为有声读物-首席AI分享圈

Audiblez: Hörbücher erstellen, eBooks in Hörbücher umwandeln mit Kokoro

Allgemeine Einführung Audiblez ist ein Open-Source-Projekt zur Konvertierung von eBooks (z. B. im .epub-Format) in Hörbücher (z. B. im .m4b-Format). Das Projekt nutzt die hochwertige Sprachsynthesetechnologie von Kokoro, um mehrere Sprachen und Stimmen zu unterstützen. Benutzer können eBooks mit einer einfachen Befehlszeile konvertieren ...

2025-01-16AI-Tools AI Open-Source-Projekt AI Text-to-Speech

Search o1：赋予推理模型主动搜索能力，让大模型边思考边搜索外部知识-首席AI分享圈

Suche o1: Ermächtigung von Inferenzmodellen zur aktiven Suche, so dass große Modelle während des Denkens nach externem Wissen suchen können

Umfassende Einführung Search-o1 ist ein Open-Source-Projekt, das darauf abzielt, die Leistung von Large-Scale-Reasoning-Modellen (LRMs) durch die Integration fortgeschrittener Suchmechanismen zu verbessern. Die Kernidee besteht darin, das Problem des Wissensdefizits, das im Schlussfolgerungsprozess auftritt, durch dynamische Suche und Wissensintegration zu lösen. Das Projekt wird vom sunnynexus-Team entwickelt, ...

2025-01-15AI-Tools AI Open-Source-Projekt AI-Suchwerkzeuge

Trae Chinese Version Erste Einladung zum Download: Unbegrenzte Nutzung von DeepSeek-R1 nach Registrierung!

Aktivieren Sie Builder intelligenten Programmiermodus, unbegrenzte Nutzung von DeepSeek-R1 und DeepSeek-V3, reibungslosere Erfahrung als die Übersee-Version. Geben Sie einfach die chinesischen Befehle, keine Programmierkenntnisse können auch Null-Schwelle, um ihre eigenen Anwendungen zu schreiben.

2025-05-09

Llama 3.2 Reasoning WebGPU: Ausführen von Llama-3.2 in einem Browser

Allgemeine Einführung Transformers.js ist eine JavaScript-Bibliothek, die von Hugging Face zur Verfügung gestellt wird. Sie wurde entwickelt, um hochmoderne Modelle für maschinelles Lernen direkt im Browser auszuführen, ohne Serverunterstützung. Die Bibliothek ist vergleichbar mit Hugging Face's Transformers-Bibliothek für Python und unterstützt eine Vielzahl von...

2025-01-15AI-Nachrichten AI Open-Source-Projekt Lokaler Einsatz von Open Source Big Model Tools

MoneyPrinter V2：自动生成YouTube短视频与Twitter内容并发布-首席AI分享圈

MoneyPrinter V2: Automatisch kurze YouTube-Videos und Twitter-Inhalte erstellen und veröffentlichen

Allgemeine Einführung MoneyPrinter V2 ist ein Open-Source-Projekt, das von FujiwaraChoki entwickelt wurde, um Benutzern zu helfen, durch Automatisierung online Geld zu verdienen. Das Projekt integriert hauptsächlich Twitter-Automatisierung, YouTube-Kurzvideo-Generierung und Affiliate-Marketing und andere Funktionen. Benutzer können Python-Skripte für Inhalte verwenden...

2025-01-15AI-Tools AI Side Hustle Geldverdienen Projekt AI Open-Source-Projekt KI-Vermarktung

RTranslator：语音实时翻译安卓应用，免费且支持离线使用-首席AI分享圈

RTranslator: eine Echtzeit-Sprachübersetzungs-App für Android, kostenlos und offline!

Allgemeine Einführung RTranslator ist eine fast quelloffene, kostenlose Offline-Echtzeit-Übersetzungs-App für Android-Geräte. Benutzer können ihr Telefon in der Tasche lassen, indem sie ein Bluetooth-Headset anschließen und eine Konversation mit anderen führen, als ob sie ihre eigene Sprache sprechen.RTranslator unterstützt mehrere Modi, einschließlich...

2025-01-15AI-Tools AI Open-Source-Projekt AI-Übersetzung

Gemini Next Chat：一键免费部署您的私人多模态Gemini应用-首席AI分享圈

Gemini Next Chat: Stellen Sie Ihre private multimodale Gemini-App kostenlos mit einem Klick bereit!

Allgemeine Einführung Gemini Next Chat ist ein Open-Source-Projekt, das Benutzern helfen soll, private Gemini-Anwendungen einfach einzusetzen. Das Projekt unterstützt Gemini 1.5 und Gemini 2.0 multimodales Modell, Benutzer können mit einem Klick auf Vercel kostenlos bereitstellen.Gemini Next Chat bietet plattformübergreifende Client ...

2025-01-15AI-Tools AI Open-Source-Projekt AI-Lokalisierte Chat-App

AutoMouser: Generierung von Browser-Automatisierungscode zur Umwandlung von Mausaktionen in Selenium-Python-Skripte über KI

Allgemeine Beschreibung AutoMouser ist eine Chrome-Erweiterung, die auf intelligente Weise Benutzerinteraktionen verfolgt und automatisch Selenium-Testcode unter Verwendung der GPT-Modelle von OpenAI generiert. Dies geschieht durch Aufzeichnung von Benutzer-Browser-Aktionen und deren Umwandlung in robuste, wartbare Python-Selenium-Skripte,...

2025-01-15AI-Tools AI Open-Source-Projekt Intelligente Desktop-Automatisierung

Vanna: Verwendung von RAG-Techniken zur Erstellung genauer SQL-Abfragen aus Text

Allgemeine Einführung Vanna ist ein vom MIT lizenziertes Open-Source-Python-Framework, das sich auf die Generierung von SQL-Abfragen durch RAG-Techniken (Retrieval Augmented Generation) konzentriert. Benutzer können RAG-Modelle trainieren, sie auf ihre eigenen Daten anwenden und dann Fragen stellen, woraufhin Vanna die entsprechenden SQL-Abfragen zurückgibt. Diese Abfragen können automatisch in...

2025-01-15AI-Tools AI Open-Source-Projekt AI-Datenanalyse Wissensabfrage und der RAG-Rahmen

SVFR：实现视频人脸修复的统一框架，修复黑白、模糊的人像老视频-首席AI分享圈

SVFR: Ein einheitlicher Rahmen für die Implementierung von Video-Gesichtsreparaturen, Reparatur von Schwarz-Weiß-Videos, verschwommenen Porträts und alten Videos

Umfassende Einführung SVFR (Stable Video Face Restoration) ist ein einheitliches Framework für die Restaurierung von Videogesichtern, das die Aufgaben Basic Face Restoration (BFR), Colouring, Repair und deren Kombination unterstützt. Das Framework nutzt generative und bewegungsbezogene A-priori-Methoden, um aufgabenspezifische Informationen durch ein einheitliches Framework zur Gesichtsrestauration zu integrieren und...

2025-01-14AI-Tools AI-Bildvergrößerung und -Wiederherstellung AI Open-Source-Projekt

LiveTalking：开源实时互动数字人直播系统，实现音视频同步对话-首席AI分享圈

LiveTalking: quelloffenes, interaktives, digitales Echtzeit-Live-System, das einen synchronen Audio- und Videodialog ermöglicht

Umfassende Einführung LiveTalking ist ein quelloffenes interaktives digitales Echtzeit-Menschensystem, das sich dem Aufbau einer hochwertigen digitalen menschlichen Live-Lösung verschrieben hat. Das Projekt verwendet das Apache 2.0 Open-Source-Protokoll und integriert eine Reihe von Spitzentechnologien, einschließlich ER-NeRF-Rendering, Echtzeit-Audio- und Video-Stream-Verarbeitung, Lippensynchronisation und so weiter. Das System unterstützt echte ...

2025-01-14AI-Tools AI Open-Source-Projekt AI digitaler Mensch

Aider：开源编程助手工具，使用AI助手进行代码编写和文件编辑-首席AI分享圈

Aider: Open-Source-Programmierassistent, KI-Assistent zum Schreiben von Code und Bearbeiten von Dateien

Allgemeine Einführung Aider ist ein leistungsstarkes Open-Source-KI-Programmierassistententool, das Entwicklern beim Schreiben, Bearbeiten und Refactoring von Code durch Dialoge in natürlicher Sprache hilft. Als interaktives KI-Paar-Programmierwerkzeug unterstützt Aider viele wichtige Programmiersprachen, integriert sich nahtlos in Git-Workflows und kann...

2025-01-14AI-Tools AI Open-Source-Projekt AI-Programmierung

JoyGen: Audiogesteuerte 3D-Tiefenerkennung für sprechende Porträtvideos

Umfassende Einführung JoyGen ist ein innovatives zweistufiges Videogenerierungssystem für sprechende Gesichter, das sich auf die Lösung des Problems der audiogesteuerten Gesichtsausdrucksgenerierung konzentriert. Es wurde von einem Team von Jingdong Technology entwickelt und verwendet fortschrittliche 3D-Rekonstruktionstechniken und Methoden zur Extraktion von Audiomerkmalen, um die Identitätsmerkmale und Ausdruckskoeffizienten des Sprechers genau zu erfassen...

2025-01-14AI-Tools AI Open-Source-Projekt AI digitaler Mensch

VSR：AI技术无损去除视频水印和硬字幕软件（视频去水印客户端7G+）-首席AI分享圈

VSR: KI-Technologie zur verlustfreien Entfernung von Video-Wasserzeichen und Software zur Erstellung von Untertiteln (Client zur Entfernung von Video-Wasserzeichen 7G+)

Umfassende Einführung Video Subtitle Remover (Video-Subtitle-Remover, kurz VSR) ist eine auf KI-Technologie basierende Videoverarbeitungssoftware, die speziell für die Entfernung von harten Untertiteln und Textwasserzeichen aus Videos entwickelt wurde. Das Tool verwendet eine Vielzahl von KI-Algorithmusmodellen (STTN, LAMA, PROPAINTER), um auf intelligente Weise...

2025-01-14AI-Tools AI Open-Source-Projekt AI Audio- und Videobearbeitung

TimesFM 2.0: Google veröffentlicht ein vortrainiertes Modell für Zeitreihenvorhersagen

Umfassende Einführung TimesFM 2.0 - 500M PyTorch ist ein vortrainiertes Zeitreihen-Basismodell, das von Google Research entwickelt wurde und für die Vorhersage von Zeitreihen konzipiert ist. Das Modell kann Kontextlängen von bis zu 2048 Zeitpunkten verarbeiten und unterstützt beliebige Vorhersagebereiche.TimesFM 2.0 ist in mehreren...

2025-01-14AI-Tools AI Open-Source-Projekt

WeChat Video No. Downloader: Schnelles Herunterladen von WeChat Video No. Video, unterstützt mehrere Formate und Plattformen

Umfassende Einführung WeChat Video No. Downloader ist ein Open-Source-Projekt, das Benutzern helfen soll, schnell Videoinhalte von WeChat-Videonummern herunterzuladen. Das Tool unterstützt eine Vielzahl von Videoformaten und Plattformen, und Benutzer können es problemlos auf Windows- und macOS-Systemen verwenden. Das Projekt wird von ltaoo entwickelt und auf GitHub gehostet, Benutzer...

2025-01-14AI-Tools AI Open-Source-Projekt

Riona-AI-Agent：社交媒体自动化互动智能体，自动搜索、点赞、留言-首席AI分享圈

Riona-AI-Agent: automatisierte interaktive Intelligenzen für soziale Medien, die automatisch suchen, liken und Kommentare hinterlassen

Allgemeine Einführung Riona-AI-Agent ist ein innovatives KI-gestütztes Automatisierungstool, das speziell für die Verwaltung und Optimierung des Betriebs der wichtigsten Social-Media-Plattformen entwickelt wurde. Es nutzt fortschrittliche KI-Modelle, um intelligente Content-Generierung und Account-Management-Funktionen für Plattformen wie Instagram, Twitter und GitHub bereitzustellen. Das System...

2025-01-14AI-Tools AI Open-Source-Projekt AI Soziale Medien

NV Ingest：解析复杂格式文档，提取多模态数据为元数据和文本-首席AI分享圈

NV Ingest: Parsing komplexer Formatdokumente, Extraktion multimodaler Daten in Metadaten und Text

Umfassende Einführung NV Ingest (NVIDIA Ingest) ist eine Reihe von Microservices für den frühen Zugriff, die für das Parsen von Hunderttausenden von komplexen, unübersichtlichen unstrukturierten PDFs und anderen Unternehmensdokumenten entwickelt wurden. Sie kann diese Dokumente in Metadaten und Text umwandeln, um sie in Retrievalsysteme einzubetten....

2025-01-14AI-Tools AI Open-Source-Projekt Extraktion und Reinigung von Dokumenten

"Always-On" Deepseek AI Assistant: Aufbau eines intelligenten Sprachinteraktionssystems auf Basis von Deepseek-V3

Umfassende Einführung Always-On AI Assistant ist ein innovatives KI-Assistentenprojekt, das durch die Integration fortschrittlicher Technologien wie Deepseek-V3, RealtimeSTT und Typer ein leistungsstarkes und permanent online verfügbares KI-Assistenzsystem schafft. Das Projekt ist speziell für technische Entwicklungsszenarien optimiert und bietet eine komplette...

2025-01-14AI-Tools AI Open-Source-Projekt Multimodale interaktive Produkte in Echtzeit

STAR: Spatial Timing Enhancement AI Model zur Verbesserung der Schärfe der Videoauflösung

Umfassende Einführung STAR (Spatial-Temporal Augmentation with Text-to-Video Models) ist ein innovativer Rahmen für die Video-Superauflösung, der gemeinsam von der Nanjing University, ByteDance und der Southwest University entwickelt wurde. Das Projekt widmet sich der Lösung von Schlüsselproblemen in der realen Video-Superauflösungsverarbeitung durch...

2025-01-13AI-Tools AI-Bildvergrößerung und -Wiederherstellung AI Open-Source-Projekt

vorhergehende Seite
1
---
28
29
30
31
32
33
34
...
nächste Seite
Insgesamt 54 Seiten