Inhaltsverzeichnis
Sprach-Ein- und Ausgabe in LibreChat
Übersicht
Für wen ist diese Seite? Fortgeschrittene Benutzer, die freihändig arbeiten oder die Barrierefreiheit verbessern möchten.
Was erwartet Sie? Lernen Sie beide Sprachfunktionen kennen: Sprechen statt Tippen (STT) und Antworten vorlesen lassen (TTS). Mit Vergleich Browser vs. externe Engine.
Hauptthemen auf dieser Seite:
- Speech to Text (STT) - Spracheingabe aktivieren und nutzen
- Text to Speech (TTS) - Sprachausgabe aktivieren und nutzen
- Browser vs. Extern - Welche Engine ist besser? (Qualität und Funktionalität)
Hinweis: Für grundlegende Einstellungen siehe Benutzeroberfläche - Einstellungen - Speech.
Aktivierung und Nutzung
Einstellungen öffnen: Siehe Benutzeroberfläche - Einstellungen - Speech.
Speech to Text (Spracheingabe)
Aktivierung:
- Öffnen Sie die Einstellungen (Benutzername unten links → Einstellungen)
- Scrollen Sie zum Abschnitt „Speech“
- Aktivieren Sie den Schalter bei „Speech to Text“
- Wählen Sie eine Engine (Browser oder Extern)
- Wählen Sie die Sprache (z.B. Deutsch, Englisch)
Nutzung im Chat:
- Klicken Sie auf das Mikrofon-Symbol im Eingabefeld
- Beginnen Sie zu sprechen
- Ihre Worte werden automatisch in Text umgewandelt
- Der Text erscheint im Eingabefeld
- Senden Sie die Nachricht wie gewohnt ab
Text to Speech (Sprachausgabe)
Aktivierung:
- Öffnen Sie die Einstellungen (Benutzername unten links → Einstellungen)
- Scrollen Sie zum Abschnitt „Speech“
- Aktivieren Sie den Schalter bei „Text to Speech“
- Wählen Sie eine Engine (Browser oder Extern)
- Wählen Sie eine Stimme
Nutzung im Chat:
- Die KI hat eine Antwort geschrieben
- Klicken Sie auf das Lautsprecher-Symbol unter der Nachricht
- Die Nachricht wird vorgelesen
Browser vs. Externe Engine
Beide Funktionen (STT und TTS) bieten zwei Optionen:
Browser-Engine
Funktionsweise: Nutzt die eingebaute Sprachfunktionen Ihres Browsers (Web Speech API).
Vorteile:
- Funktioniert direkt im Browser
- Keine zusätzlichen Kosten
- Schnell
- Verarbeitet lokal
Nachteile:
- STT: Funktioniert nur, wenn Browser die Funktion unterstützt; Qualität hängt vom Browser ab; möglicherweise weniger genau
- TTS: Stimmen können roboterhaft klingen; Qualität hängt vom Browser und Betriebssystem ab; weniger natürlich
Beispiel-Stimmen (TTS, Windows): Microsoft Hedda/Stefan - German (Germany)
Wann nutzen?: Für normale Nutzung, wenn Sie im Browser bleiben möchten.
Externe Engine (OpenAI)
Funktionsweise:
- STT: Leitet Audiodaten an den Whisper-Dienst von OpenAI weiter
- TTS: Nutzt die professionelle Text-to-Speech-Engine von OpenAI
Vorteile:
- STT: Sehr hohe Genauigkeit; funktioniert in allen Browsern; unterstützt viele Sprachen sehr gut; professionelle Spracherkennung
- TTS: Sehr natürlich klingende Stimmen; hohe Qualität; professionelle Sprachausgabe; konsistent über alle Browser hinweg
Verfügbare Stimmen (TTS, OpenAI):
- alloy: Neutral, ausgewogen
- echo: Männlich, klar
- fable: Britisch, angenehm
- onyx: Tief, männlich
- nova: Freundlich, weiblich
- shimmer: Sanft, weiblich
Nachteile:
- Leicht höhere Latenz
- Verbraucht Ressourcen
Wann nutzen?: Wenn Sie höchste Genauigkeit (STT) oder natürlich klingende Stimmen (TTS) benötigen.
