AI Personal Learning
und praktische Anleitung
CyberKnife-Zeichenspiegel
Insgesamt 1020 Artikel

Tags: KI Open-Source-Projekte Seite 26

Onlook:面向前端设计开源Cursor,在React应用中设计并发布代码-首席AI分享圈

Onlook: Open Source Cursor für Front-End-Design, Entwurf und Veröffentlichung von Code in React-Anwendungen

Allgemeine Einführung Onlook ist ein Open-Source-Design-Tool für Designer und Entwickler, mit dem Benutzer direkt in einer laufenden React-Anwendung entwerfen und Designänderungen in Code umwandeln können. Das Tool bietet ein intuitives visuelles Bearbeitungserlebnis, ähnlich wie Figma oder Webflow, aber mit dem Fokus auf...

YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格-首席AI分享圈

YuE: Wandelt Liedtexte in ein Basismodell eines kompletten Songs um und unterstützt eine breite Palette von Musikstilen

Allgemeine Einführung YuE ist ein Open-Source-Basismodell für die Generierung kompletter Songs, das sich auf die Umwandlung von Liedtexten in komplette Songs konzentriert. Im Gegensatz zu anderen Modellen, die nur kurze Schnipsel von nicht gesungener Musik generieren, ist YuE in der Lage, ganze Songs mit Lead- und Backing Vocals von bis zu mehreren Minuten Länge zu generieren. Das Modell löst das Problem der Musikgenerierung von langen...

Cog-ComfyUI:使用API运行ComfyUI工作流-首席AI分享圈

Cog-ComfyUI: Ausführen von ComfyUI-Workflows mit APIs

Allgemeine Einführung Cog-ComfyUI ist ein Open-Source-Projekt, mit dem ComfyUI-Workflows über eine API ausgeführt werden können. Das vom GitHub-Benutzer fofr erstellte Projekt bietet eine effiziente Möglichkeit, ComfyUI-Workflows zu integrieren und auszuführen.ComfyUI ist eine Benutzeroberfläche für die Bilderzeugung und -manipulation, die eine Vielzahl von Modellen unterstützt...

Supermemory:导入书签和网页内容构建个人知识库-首席AI分享圈

Supermemory: Importieren von Lesezeichen und Webinhalten zum Aufbau einer persönlichen Wissensdatenbank

Allgemeine Einführung Supermemory ist ein Open-Source-Projekt, das Nutzern helfen soll, ihr "zweites Gehirn" aufzubauen. Mit einer leistungsstarken Chrome-Erweiterung und KI-Technologie ermöglicht es Nutzern, Informationen aus verschiedenen Quellen wie Webseiten, Twitter-Lesezeichen usw. einfach zu speichern, zu organisieren und abzurufen...

Open NotebookLM:将PDF转换为播客的开源工具-首席AI分享圈

Open NotebookLM: PDF in Podcasts von Open-Source-Tools konvertieren

Allgemeine Einführung Open NotebookLM ist ein Open-Source-Projekt zur Umwandlung beliebiger PDF-Dokumente in einen Podcast. Das Tool verwendet quelloffene Large Language Model (LLM)- und Text-to-Speech (TTS)-Modelle, um PDF-Inhalte zu verarbeiten, natürliche Dialoge zu erzeugen, die für Audio-Podcasts geeignet sind, und diese in MP3-Dateien auszugeben. Das Projekt wird unterstützt von der N...

Qwen2.5-VL:支持图像视频文档解析的开源多模态大模型-首席AI分享圈

Qwen2.5-VL: Ein quelloffenes multimodales Großmodell für die Analyse von Bild- und Videodokumenten

Umfassende Einführung Qwen2.5-VL ist ein quelloffenes multimodales großes Modell, das vom Qwen-Team der Alibaba Cloud (Alibaba Cloud) entwickelt wurde. Es kann gleichzeitig Text, Bilder, Videos und Dokumente verarbeiten und ist eine aktualisierte Version von Qwen2-VL, die auf dem Qwen2.5-Sprachmodell aufbaut. Offiziell kann es für das Parsen von Dokumenten, das Verstehen von Videos und die...

Lux:几乎支持所有视频平台的命令行视频下载器-首席AI分享圈

Lux: Kommandozeilen-Videodownloader, der fast alle Videoplattformen unterstützt

Allgemeine Einführung Lux ist eine schnelle und einfache Video-Download-Bibliothek und Kommandozeilen-Tool in Go geschrieben. Es unterstützt das Herunterladen von Videos von mehreren Websites, einschließlich YouTube, Bilibili, Youku, usw. Lux bietet eine Vielzahl von Download-Optionen und Funktionen, wie Multi-Thread-Downloads, Haltepunkte, automatische Wiederholungen, usw., extrem...

Langui:开源的AI用户界面组件库-首席AI分享圈

Langui: eine quelloffene Bibliothek von KI-Benutzerschnittstellen-Komponenten

Allgemeine Einführung Langui von LangbaseInc ist eine Open-Source-Bibliothek für Benutzeroberflächenkomponenten, die für generative KI- und Large Language Modelling (LLM)-Projekte entwickelt wurde. Basierend auf Tailwind CSS bietet die Bibliothek eine Sammlung von vorgefertigten UI-Komponenten, um Entwicklern zu helfen, KI-Anwendungen schnell zu erstellen und einzusetzen.

MNN-LLM-Android:MNN 多模态语言模型的安卓应用-首席AI分享圈

MNN-LLM-Android: MNN Multimodale Sprachmodellierung für Android

Umfassende Einführung MNN (Mobile Neural Network) ist ein effizientes, leichtgewichtiges Deep-Learning-Framework, das von Alibaba entwickelt und für mobile Geräte optimiert wurde.MNN ist nicht nur in der Lage, schnelle Inferenzen auf mobilen Geräten durchzuführen, sondern unterstützt auch multimodale Aufgaben, einschließlich der Text-, Bild- und Audioverarbeitung.M...

AI RSS生成器:通过AI将网页内容转换为RSS订阅源的工具-首席AI分享圈

AI RSS Generator: ein Tool zur Umwandlung von Webinhalten in RSS-Feeds mittels AI

Allgemeine Einführung AI RSS ist ein innovatives Tool zur Umwandlung von Webinhalten in RSS-Feeds durch KI-Technologie. Es besteht aus zwei Hauptteilen: einem Browser-Plugin und einer Serverseite. Das Browser-Plugin ermöglicht es dem Benutzer, Listen aus Webseiten auszuwählen und strukturierte Datenbeschreibungsdateien (SDD) zu erzeugen, während die Serverseite...

UltraRAG:一站式RAG系统解决方案,简化数据构建与模型微调-首席AI分享圈

UltraRAG: Eine RAG-Systemlösung aus einer Hand zur Vereinfachung der Datenerstellung und Modellfeinabstimmung

Umfassende Einführung UltraRAG ist eine RAG-Systemlösung (Retrieval Augmented Generation), die gemeinsam von der THUNLP-Gruppe an der Tsinghua University, der NEUIR-Gruppe an der Northeastern University, Modelbest.Inc und dem 9#AISoft-Team entwickelt wurde. Der Rahmen basiert auf agilem Einsatz und modularem Aufbau und bietet automatisierte Datenkonstruktion, Modellfeinabstimmung und Inferenz...

Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型-首席AI分享圈

Llasa 1~8B: ein quelloffenes Text-zu-Sprache-Modell für hochwertige Spracherzeugung und Klonen

Allgemeine Einführung Llasa-3B ist ein Open-Source-Text-to-Speech-Modell (TTS), das vom Audio Lab der Hong Kong University of Science and Technology (HKUST Audio) entwickelt wurde. Das Modell basiert auf der Llama-3.2B-Architektur, die sorgfältig abgestimmt wurde, um eine qualitativ hochwertige Spracherzeugung zu ermöglichen, die nicht nur mehrere Sprachen unterstützt, sondern auch emotionalen Ausdruck und Persönlichkeit ermöglicht...

Fast GraphRAG:高准确率且低成本的图形化检索增强生成工具-首席AI分享圈

Fast GraphRAG: Ein hochpräzises und kostengünstiges Werkzeug zur Erzeugung grafischer Sucherweiterungen

Umfassende Einführung Fast GraphRAG ist ein Open-Source-Tool, das von Circlemind AI entwickelt wurde, um eine effiziente und genaue Retrieval Augmentation Generation (RAG) durch Knowledge Graph- und PageRank-Algorithmen zu ermöglichen. Das Tool passt sich intelligent an die Nutzungsszenarien, Daten und Abfrageanforderungen des Benutzers an, um interpretierbare, kostengünstige...

Open R1:Hugging Face 复现 DeepSeek-R1 的训练过程-首席AI分享圈

Open R1: Umarmendes Gesicht repliziert den DeepSeek-R1 Trainingsprozess

Allgemeine Einführung Hugging Face's Open R1-Projekt ist ein vollständig quelloffenes DeepSeek-R1-Replikationsprojekt, das darauf abzielt, die fehlenden Teile der R1-Pipeline zu erstellen, so dass jeder sie replizieren und darauf aufbauen kann. Das Projekt ist einfach aufgebaut und besteht hauptsächlich aus Skripten für das Training und die Auswertung von Modellen und die Erzeugung synthetischer Daten....

Open Operator:通过AI智能体在云浏览器中执行自动化操作-首席AI分享圈

Open Operator: Automatisierung in Cloud Browsern mit KI-Intelligenz

Allgemeine Einführung Open Operator ist ein Open-Source-Projekt, das darauf abzielt, Operationen im Browser durch KI-Intelligenzen zu automatisieren. Das von Browserbase entwickelte Projekt kombiniert die Technologien von Stagehand und Browserbase, um es den Benutzern zu ermöglichen, das Verhalten des Browsers durch natürlichsprachliche Befehle zu...

de_DEDeutsch