🚀 Einladung zum Erleben: Chinas erste KI-IDE Intelligente Programmiersoftware Trae Chinesische Version downloadDer DeepSeek-R1 und Doubao-pro sind unbegrenzt verfügbar!

Insgesamt 53 Artikel

Tags: ai Sprache zu Text Seite 2

Orate: Eine einheitliche API für die Integration von bekannter Spracherzeugung, Sprachtranskription und Sprachmodellierung

Allgemeine Beschreibung Orate ist ein KI-Toolkit, das sich auf Spracherzeugung und Transkription konzentriert. Es bietet eine einheitliche API, die sich nahtlos mit führenden KI-Anbietern wie OpenAI, ElevenLabs und AssemblyAI integrieren lässt, um Anwendern bei der Erstellung realistischer, menschenähnlicher Sprache und der Transkription von Audio in Text zu...

2025-02-01AI-Tools AI Open-Source-Projekt AI Text-to-Speech AI Speech to Text

PengChengStarling：对比Whisper-Large v3更小、更快的多语言语音转文字工具-首席AI分享圈

PengChengStarling: Kleineres und schnelleres mehrsprachiges Speech-to-Text-Tool als Whisper-Large v3

Umfassende Einführung PengChengStarling (PengCheng Labs) ist ein mehrsprachiges automatisches Spracherkennungswerkzeug (ASR), das Sprache in verschiedenen Sprachen in entsprechenden Text umwandeln kann. Dieses Toolkit wurde auf der Grundlage des icefall-Projekts entwickelt und bietet einen kompletten Spracherkennungsprozess, einschließlich Datenverarbeitung, Modelltraining,...

2025-01-30AI-Tools AI Open-Source-Projekt AI Speech to Text

Trae Chinese Version Erste Einladung zum Download: Unbegrenzte Nutzung von DeepSeek-R1 nach Registrierung!

Aktivieren Sie Builder intelligenten Programmiermodus, unbegrenzte Nutzung von DeepSeek-R1 und DeepSeek-V3, reibungslosere Erfahrung als die Übersee-Version. Geben Sie einfach die chinesischen Befehle, keine Programmierkenntnisse können auch Null-Schwelle, um ihre eigenen Anwendungen zu schreiben.

2025-04-29

RealtimeSTT：实时语音转文字工具，基于Whisper实现低延迟流式语音识别-首席AI分享圈

RealtimeSTT: Echtzeit-Sprache-zu-Text-Tool für Streaming-Spracherkennung mit niedriger Latenzzeit auf der Grundlage von Whisper

Allgemeine Einführung RealtimeSTT ist eine effiziente Echtzeit-Bibliothek für die Umwandlung von Sprache in Text mit geringer Latenz und fortschrittlicher Erkennung von Sprachaktivität und Aktivierung von Wachwörtern. Sie wurde von Kolja Beigel entwickelt, um Anwendungen zu unterstützen, die eine schnelle und genaue Sprache-zu-Text-Konvertierung benötigen. Ob Sie nun ein Sprachassistent sind oder eine...

2025-01-18AI-Nachrichten AI Open-Source-Projekt AI Speech to Text

Sherpa-ONNX：使用ONNXRuntime实现离线语音识别和合成-首席AI分享圈

Sherpa-ONNX: Offline-Spracherkennung und -synthese mit ONNXRuntime

Allgemeine Einführung sherpa-onnx ist ein Open-Source-Projekt, das vom Next-gen Kaldi-Team entwickelt wurde, um effiziente Offline-Spracherkennung und Sprachsyntheselösungen bereitzustellen. Es unterstützt eine Vielzahl von Plattformen, einschließlich Android, iOS, Raspberry Pi, etc., kann in Abwesenheit von Netzwerkkonnektivität in Echtzeit sein...

2025-01-16AI-Tools AI Open-Source-Projekt AI Text-to-Speech AI Speech to Text

Acoust: Online-KI-Spracherzeugung und Text-to-Speech (TTS)-Dienstplattformen

Acoust ist eine Online-KI-Stimmengenerierungs- und Text-to-Speech (TTS)-Dienstleistungsplattform, die die neueste KI-Technologie verwendet, um realistische Sprache zu erzeugen. Die Plattform bietet auch leistungsstarke Videobearbeitungstools, mit denen Benutzer Videos erstellen können, ohne mehrere Softwareprogramme verwenden zu müssen....

2025-01-10AI-Tools AI Text-to-Speech AI Speech to Text

Notta：AI会议记录与音频转录工具，自动转录会议、采访或录音-首席AI分享圈

Notta: KI-Tool zur Aufzeichnung und Transkription von Besprechungen, Interviews oder Aufzeichnungen

Allgemeine Einführung Notta ist ein leistungsstarkes KI-Tool für die Aufzeichnung und Transkription von Besprechungen, Interviews oder Audioaufnahmen, das den Benutzern hilft, Besprechungen automatisch in durchsuchbaren Text umzuwandeln. Mit Notta können Benutzer einfach transkribieren, bearbeiten, zusammenfassen und zusammenarbeiten, um die Produktivität zu steigern....

2025-01-09AI-Tools KI-Tool zur Zusammenfassung von Text und Audio/Video AI Speech to Text

AI no jimaku gumi: Automatische Generierung und Übersetzung von mehrsprachigen Untertiteln für Videos mit Hilfe von KI

Allgemeine Einführung AI no jimaku gumi (AI no subtitle group) ist ein leistungsfähiges Kommandozeilen-Tool zur Verarbeitung von Videountertiteln, das sich auf die automatische Extraktion, Transkription und Übersetzung von Videountertiteln konzentriert. Das Tool integriert fortschrittliche KI-Technologien, darunter das Whisper-Spracherkennungsmodell und eine Vielzahl von Übersetzungs-Backends (wie Dee...

2025-01-06AI-Tools AI Open-Source-Projekt AI-Übersetzung AI Speech to Text

FunClip：智能剪辑视频内容为短片，轻松实现精准视频片段提取/裁剪-首席AI分享圈

FunClip: Intelligente Bearbeitung von Videoinhalten zu Kurzfilmen, einfaches und genaues Extrahieren/Zuschneiden von Videoclips

Umfassende Einführung FunClip ist ein vollständig quelloffenes, lokalisiertes, automatisiertes Videobearbeitungsprogramm, das vom TONGYI Speech Lab des Alibaba Dharma Institute entwickelt wurde. Das Tool integriert das industrietaugliche Spracherkennungsmodell Paraformer-Large, das Sprachinhalte in Videos genau erkennen und in Text umwandeln kann. Besondere Merkmale...

2025-01-03AI-Tools AI Open-Source-Projekt AI Speech to Text AI Audio- und Videobearbeitung

BetterWhisperX：自动语音识别与说话人分离，提供高精度单词级时间戳-首席AI分享圈

BetterWhisperX: Automatische, vom Sprecher getrennte Spracherkennung, die hochpräzise Zeitstempel auf Wortebene liefert

Allgemeine Einführung BetterWhisperX ist eine optimierte Version des WhisperX-Projekts, das sich auf die Bereitstellung effizienter und genauer automatischer Spracherkennungsdienste (ASR) konzentriert. Als verbesserter Ableger von WhisperX wird das Projekt von Federico Torrielli betreut, der sich dafür einsetzt, dass das Projekt ständig aktualisiert und die Leistung verbessert wird...

2024-12-29AI-Tools AI Open-Source-Projekt AI Speech to Text

Freed：AI医疗抄写助手，准确转录医生和患者对话，减少就诊记录文书工作-首席AI分享圈

Freed: KI-Assistent für die medizinische Transkription, der Arzt-Patienten-Gespräche genau transkribiert und den Papierkram für die Besuchsdokumentation reduziert

Allgemeine Beschreibung Freed ist ein KI-Assistent für die medizinische Transkription, der für medizinisches Fachpersonal entwickelt wurde. Er hilft Ärzten und anderen Fachkräften im Gesundheitswesen, die Aufzeichnung von Patientenbesuchen zu automatisieren, den Papierkram zu reduzieren und die Produktivität durch fortschrittliche KI-Technologie zu steigern....

2024-12-27AI-Tools AI Speech to Text

Voicenotes：AI语音笔记，记录与转录语音，智能管理会议内容-首席AI分享圈

Voicenotes: KI-Sprachnotizen, Aufzeichnung und Transkription von Sprache, intelligente Verwaltung von Meeting-Inhalten

Allgemeine Einführung Voicenotes ist eine intelligente App für Sprachnotizen, mit der Benutzer Sprachnotizen und Besprechungen einfach aufzeichnen und verwalten können. Die App unterstützt die Sprachtranskription in mehr als 100 Sprachen. Der Benutzer spricht einfach seine Gedanken und Voicenotes transkribiert sie automatisch in Text. Egal, ob Sie Student oder Berufstätiger sind...

2024-12-25AI-Tools AI-Anmerkungen AI Speech to Text

Voice-Pro：开源多功能视频翻译工具，语音转录并翻译为多语言，Windows一键安装-首席AI分享圈

Voice-Pro: multifunktionales Open-Source-Videoübersetzungsprogramm, Sprachtranskription und Übersetzung in mehrere Sprachen, Windows-Installation mit einem Klick

Allgemeine Einführung Voice-Pro ist ein vielseitiges, auf Gradio WebUI basierendes Tool, das Sprache-zu-Text, Text-zu-Sprache, Echtzeit-Übersetzung, YouTube-Video-Downloads und die Trennung menschlicher Stimmen unterstützt. Es integriert die Technologien Whisper, Faster-Whisper und Whisper-Timestamped, um eine effiziente...

2024-11-24AI-Tools AI Open-Source-Projekt AI-Übersetzung AI Speech to Text

Zamzar：多功能在线文件格式转换工具，视频转换|音频转换|图片转换|文档转换-首席AI分享圈

Zamzar: Multifunktionales Online-Dateiformat-Konvertierungstool, Video-Konvertierung | Audio-Konvertierung | Bild-Konvertierung | Dokument-Konvertierung

Allgemeine Einführung Zamzar ist ein leistungsstarkes Online-Dateikonvertierungstool, das über 1200 Dateiformate unterstützt. Egal, ob es sich um Dokumente, Bilder, Videos, Audios oder eBooks handelt, Zamzar kann sie schnell und effizient umwandeln. Die Benutzer müssen keine Software herunterladen, sie müssen nur den Text auswählen.

2024-11-04AI-Tools AI Offene Dienste AI Speech to Text

AI Hear: Echtzeit-Sprachtranskriptions- und Übersetzungssoftware, die nativ offline läuft

Allgemeine Beschreibung Wenn Sie ein MacBook verwenden, sollten Sie AI Hear ausprobieren: Sie können Audio aufnehmen, lokale Sprache in Echtzeit in Text umwandeln, übersetzen und schließlich Untertitel exportieren. Sie können es verwenden, um Sie beim Anhören von Konferenzen über Ländergrenzen hinweg und bei englischen Hörbüchern zu unterstützen. AI Hear ist eine lokal betriebene Software, die mit einem Klick Echtzeit-Übersetzung und -Transkription bietet, mehrere...

2024-11-03AI-Tools AI-Übersetzung AI Speech to Text

SoniTranslate：开源视频翻译配音解决方案，多人配音、调整语速与模仿原声-首席AI分享圈

SoniTranslate: Open-Source-Videoübersetzungs-Synchronisationslösung, Mehrfachsynchronisation, Geschwindigkeitsanpassung und Nachahmung des Originaltons

Allgemeine Beschreibung SoniTranslate ist ein leistungsstarkes und benutzerfreundliches Tool für die mehrsprachige Synchronisation von Videos, das eine Lösung für die Übersetzung von Videos und die Synchronisierung von Audio bietet. Es verwendet fortschrittliche Spracherkennungs- und maschinelle Übersetzungstechnologien, um Videoinhalte in mehrere Sprachen zu übersetzen und den Ton zu synchronisieren. Das Projekt basiert auf Gradi...

2024-10-27AI-Tools AI Text-to-Speech AI-Übersetzung AI Speech to Text

FunASR：开源语音识别工具包，说话人分离/ 多人对话语音识别-首席AI分享圈

FunASR: Open Source Spracherkennungs-Toolkit, Sprechertrennung / Mehr-Personen-Dialog-Spracherkennung

Umfassende Einführung FunASR ist ein Open-Source-Spracherkennungs-Toolkit, das vom Dharma Institute von Alibaba entwickelt wurde, um akademische Forschung und industrielle Anwendungen zu verbinden. Es unterstützt eine breite Palette von Spracherkennungsfunktionen, einschließlich Spracherkennung (ASR), Voice Endpoint Detection (VAD), Interpunktionswiederherstellung, Sprachmodellierung, Sprecherverifizierung,...

2024-10-16AI-Tools AI Open-Source-Projekt AI Speech to Text

AsrTools：语音转字幕工具，内置剪映、快手、必剪接口的轻量客户端-首席AI分享圈

AsrTools: Werkzeug zur Umwandlung von Sprache in Untertitel, leichtgewichtiger Client mit integrierten Schnittstellen zu Cutscene, Racer und Must-Cut

Umfassende Einführung AsrTools ist ein intelligentes Sprache-zu-Text-Tool mit eingebauten Schnittstellen von großen Playern wie Cutscene, Racer, Must Cut usw. Es benötigt keine GPU oder umständliche Konfigurationen und unterstützt effiziente Multi-Thread-Stapelverarbeitung. Es wurde auf der Grundlage von PyQt5 entwickelt, mit einer schönen und benutzerfreundlichen Oberfläche, die in der Lage ist, Untertiteldateien im SRT- und TXT-Format auszugeben. Das Tool arbeitet durch Abstimmung...

2024-10-14AI-Tools AI Open-Source-Projekt AI Speech to Text

Happy Scribe：音频转录和视频字幕平台|免费视频字幕编辑软件-首席AI分享圈

Happy Scribe: Plattform für Audiotranskription und Videountertitelung | Kostenlose Software für Videountertitelung

Happy Scribe Allgemeine Beschreibung Happy Scribe bietet automatische und manuelle Audiotranskriptionsdienste zur Umwandlung von Audio in Text mit hoher Genauigkeit und Unterstützung für mehrere Sprachen und Formate. Es umfasst einen interaktiven Editor, Tools für die Zusammenarbeit, mehrere Exportformate, maschinelle Übersetzung und mehr. Die Plattform ist sicher und zuverlässig,...

2024-10-09AI-Tools AI Speech to Text AI Audio- und Videobearbeitung

Whisper GPGPU：运行在Windows的OpenAI Whisper|Whisperdesktop-首席AI分享圈

Whisper GPGPU: OpenAI Whisper läuft unter Windows|Whisperdesktop

Allgemeine Einführung Whisper ist ein Open-Source-Projekt auf GitHub, das von Const-me entwickelt wurde und sich auf die hochleistungsfähige Inferenz des automatischen Spracherkennungsmodells (ASR) Whisper von OpenAI mit GPGPU konzentriert. Dieses Projekt wird unter der MPL-2.0-Lizenz veröffentlicht, wobei die letzte Version 1.12 am 22. Juli 2023 veröffentlicht wurde. Anstelle von ...

2024-10-09AI-Tools AI Speech to Text

vorhergehende Seite
1
2
3
nächste Seite
Insgesamt 3 Seiten