AI Personal Learning
und praktische Anleitung
TRAE
Insgesamt 1020 Artikel

Tags: KI Open-Source-Projekte Seite 38

Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟-首席AI分享圈

Genesis: generative Open-Source-Physik-Engine für die physikalische 4D-Simulation einer dynamischen Welt

Allgemeine Einführung Genesis ist eine generative Physikwelt, die für die allgemeine Robotik und das verkörperte KI-Lernen entwickelt wurde. Es bietet eine einheitliche Simulationsplattform, die die Simulation einer breiten Palette von Materialien und physikalischen Phänomenen unterstützt.Genesis zielt darauf ab, eine unendliche Vielfalt von Daten durch die Kombination von generativer KI und Physiksimulation zu erschließen, um...

Kolors:生成高质量图像的文本到图像模型,支持生成中文海报-首席AI分享圈

Kolors: Text-Bild-Modell zur Erzeugung hochwertiger Bilder, mit Unterstützung für die Erstellung chinesischer Poster

Umfassende Einführung Kolors ist ein groß angelegtes Text-Bild-Erzeugungsmodell, das vom Racer-Team entwickelt wurde und auf Potenzialdiffusionstechniken basiert. Das Modell wurde mit Milliarden von Text-Bild-Datenpaaren trainiert und ist in der Lage, qualitativ hochwertige, komplexe und semantisch korrekte Bilder zu generieren, die sowohl chinesische als auch englische Eingaben unterstützen.Kolors ist bekannt für seine visuelle Qualität, komplexe semantische Genauigkeit...

ColorFlow:漫画着色,黑白图像自动着色,提升图像色彩一致性和质量-首席AI分享圈

ColorFlow: Cartoon Shading, automatische Schattierung von Schwarz-Weiß-Bildern zur Verbesserung der Farbkonsistenz und der Bildqualität

Umfassende Einführung ColorFlow ist ein Tool zur automatischen Einfärbung von Bildsequenzen, das vom Tencent ARC-Team entwickelt wurde, um das Problem der automatischen Einfärbung von Schwarz-Weiß-Bildsequenzen zu lösen. Das Tool nutzt den Abruf einer verbesserten Einfärbungspipeline, um die Farben verschiedener Elemente, einschließlich der Haarfarbe und der Kleidung des Charakters, aus einem Pool von Referenzbildern zu generieren und so sicherzustellen, dass die...

BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具-首席AI分享圈

BrushEdit: All-in-One-Tool für die Restaurierung und Bearbeitung von Bildern von Tencent ARC veröffentlicht

Umfassende Einführung BrushEdit ist ein von Tencent ARC Labs entwickeltes All-in-One-Werkzeug zur Bildreparatur und -bearbeitung. Das Tool basiert auf der neuesten KI-Technologie und ist in der Lage, Defekte in Bildern automatisch zu erkennen und zu reparieren, während es die interaktive Bearbeitung durch den Benutzer unterstützt.BrushEdit kombiniert eine Vielzahl von fortschrittlichen Bildverarbeitungsalgorithmen,...

Outlines:通过正则表达式、JSON或Pydantic模型生成结构化文本输出-首席AI分享圈

Umrisse: Generierung strukturierter Textausgaben über reguläre Ausdrücke, JSON oder Pydantic-Modelle

Allgemeine Einführung Outlines ist eine Open-Source-Bibliothek, die von dottxt-ai entwickelt wurde, um die Anwendung von Large Language Models (LLMs) durch strukturierte Textgenerierung zu verbessern. Die Bibliothek unterstützt eine Vielzahl von Modellintegrationen, einschließlich OpenAI, Transformatoren, llama.cpp, usw. Sie bietet einfache, aber leistungsfähige...

RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)-首席AI分享圈

RapBank: ein Modell zur direkten Generierung von Rap-Vocals aus Texten und Backing Tracks (derzeit offener Datensatz)

Allgemeine Einführung RapBank ist ein Datensatz und ein Toolset für die Erstellung von Rap-Texten. Das Projekt wurde von NZqian ins Leben gerufen, um Forschern und Entwicklern einen qualitativ hochwertigen Datensatz für Rap-Texte zur Verfügung zu stellen, indem Rap-Songs von YouTube gesammelt und verarbeitet werden.RapBank enthält über 9 ...

R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统-首席AI分享圈

R2R: Ein fortschrittliches KI-Retrieval-System (RAG) für multimodales Content-Parsing und die Kombination von Wissensgraphen mit hybrider Suche

Umfassende Einführung R2R (RAG to Riches) ist ein hochmodernes KI-Retrievalsystem, das Retrieval Augmented Generation (RAG)-Funktionen mit produktionsreifen Features unterstützt. Das System basiert auf einer containerisierten RESTful API und bietet multimodales Content-Parsing, hybride Suchfunktionen, konfigurierbare GraphRAG und umfassende...

Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析-首席AI分享圈

Megrez-3B-Omni: ein Modell für multimodales Verstehen auf der Endseite, das multimodales Verstehen und Analysieren von Text, Bild und Audio unterstützt

Umfassende Einführung Infini-Megrez ist eine Edge-Intelligence-Lösung, die von der unquestioned core dome (Infinigence AI) entwickelt wurde und darauf abzielt, effizientes multimodales Verstehen und Analysieren durch Co-Design von Hardware und Software zu erreichen. Das Herzstück des Projekts ist das Megrez-3B-Modell, das integriertes Bild-, Text- und Audioverständnis mit hoher Genauigkeit unterstützt...

RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流-首席AI分享圈

RAGFlow: eine quelloffene RAG-Engine, die auf einem tiefgreifenden Verständnis von Dokumenten basiert und effiziente Retrieval-gestützte Generierungsworkflows ermöglicht

Umfassende Einführung RAGFlow ist eine quelloffene Retrieval Augmented Generation (RAG)-Engine, die auf der Deep Document Understanding-Technologie basiert. Sie bietet einen effizienten RAG-Workflow für Unternehmen jeder Größe, der ein umfangreiches Sprachmodell (LLM) beinhaltet, das in der Lage ist, reale Frage-und-Antwort-Fähigkeiten auf der Basis von Daten in komplexen Formaten zu liefern.RAGFlow...

NodeTool:基于节点编排的AI模型工作流可视化客户端-首席AI分享圈

NodeTool: ein Workflow-Visualisierungsclient für KI-Modelle auf der Grundlage von Knotenorchestrierung

Allgemeine Einführung NodeTool ist eine innovative KI-Authoring-Plattform, die eine einfache, intuitive Schnittstelle für KI-Enthusiasten, Entwickler, Datenwissenschaftler und Kreative bietet. Egal, ob Sie ein Künstler, Entwickler oder Anfänger sind, NodeTool hilft Ihnen, Ideen schnell zu prototypisieren und zu visualisieren, ohne...

Porkybank:AI驱动的日常预算管理,轻松追踪每日预算-首席AI分享圈

Porkybank: KI-gestützte Verwaltung des Tagesbudgets für die einfache Verfolgung des Tagesbudgets

Allgemeine Beschreibung Porkybank ist eine Open-Source-Anwendung zur Verwaltung der persönlichen Finanzen, die den Nutzern helfen soll, ihr tägliches Budget leicht zu verfolgen. Mit einer einfachen Formel (Einnahmen - Ausgaben) / Tage = Bargeld, können Benutzer ihre finanzielle Situation zu visualisieren. Das Projekt wird auf GitHub gehostet und verwendet Elixir und P...

CrewAI:多角色扮演协作智能框架,简化复杂任务-首席AI分享圈

CrewAI: Ein Rahmenwerk für kollaborative Intelligenz mit mehreren Rollen zur Vereinfachung komplexer Aufgaben

Umfassende Einführung CrewAI ist ein fortschrittliches Framework zur Orchestrierung der Zusammenarbeit zwischen Rollenspielen und autonomen KI-Agenten. Durch die Erleichterung der kollaborativen Intelligenz ermöglicht CrewAI den Agenten eine nahtlose Zusammenarbeit zur Lösung komplexer Aufgaben. Ob beim Aufbau intelligenter Assistentenplattformen, bei der Automatisierung von Kundenservice-Teams oder bei Multi-Agenten-Forschungsteams, Crew...

Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型-首席AI分享圈

Leffa: High-fidelity model virtual fitting and character pose adjustment, Meta open source controllable character image generation model

Umfassende Einführung Leffa ist ein einheitliches Framework für die Erzeugung kontrollierbarer Charakterbilder, das eine präzise Manipulation des Erscheinungsbilds (z. B. virtuelle Anpassung) und der Pose (z. B. Pose-Transfer) ermöglicht. Das Framework reduziert die Verzerrung feinkörniger Details erheblich, indem es die Zielabfrage auf den korrekten Referenzschlüssel in der Aufmerksamkeitsebene lenkt und gleichzeitig die...

MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具-首席AI分享圈

MMAudio: Erzeugung von synchronisierten Soundeffekten und Tonspuren für Videomaterial, multimodales Co-Trainingstool für Video und Audio

Allgemeine Einführung MMAudio ist ein Open-Source-Projekt, das darauf abzielt, durch gemeinsames multimodales Training hochwertiges synchronisiertes Audio zu erzeugen. Entwickelt von Ho Kei Cheng und anderen an der Chinese University of Hong Kong, besteht die Hauptfunktion des Projekts in der Erzeugung von synchronisiertem Audio auf der Grundlage von Video- und/oder Texteingaben....

H2O GPT:灵活配置的本地AI对话与文档处理工具-首席AI分享圈

H2O GPT: Flexible Konfiguration von nativen KI-Dialog- und Dokumentenverarbeitungswerkzeugen

Allgemeine Einführung H2O GPT ist ein Open-Source-Projekt, das darauf abzielt, privatisierte Chat- und Dokumentenverarbeitungsfunktionen bereitzustellen. Das Projekt basiert auf der Apache 2.0-Lizenz und unterstützt eine Vielzahl von GPT-Modellen, einschließlich LLaMa2, Mistral, Falcon und so weiter. Benutzer können H2O GPT verwenden, um lokale Dokumente (wie PDF, E...

OpenChat:快速集成多数据源的自定义聊天机器人-首席AI分享圈

OpenChat: Benutzerdefinierte Chatbots für die schnelle Integration mehrerer Datenquellen

Allgemeine Einführung OpenChat ist eine benutzerfreundliche Chatbot-Konsole, die entwickelt wurde, um die Verwendung von Large Language Models (LLMs) zu vereinfachen. Durch einen zweistufigen Einrichtungsprozess ermöglicht OpenChat seinen Nutzern die einfache Erstellung und Verwaltung mehrerer benutzerdefinierter Chatbots. Die Plattform unterstützt GPT-3 und GPT-4 Modelle und...

LocalGPT:在本地设备上与多文档对话,确保数据隐私-首席AI分享圈

LocalGPT: Gewährleistung des Datenschutzes durch Kommunikation mit mehreren Dokumenten auf lokalen Geräten

Allgemeine Einführung LocalGPT ist ein Open-Source-Projekt, das es Benutzern ermöglichen soll, mit Dokumenten auf lokalen Geräten zu kommunizieren und dabei den Datenschutz zu gewährleisten. Durch die Verwendung verschiedener Open-Source-Modelle kann LocalGPT Dokumenteninhalte verarbeiten und verstehen, ohne Daten in die Cloud hochzuladen. Das Projekt unterstützt eine Vielzahl von Plattformen, darunter GPU, C...

de_DEDeutsch