Sprach-Ein- und Ausgabe in LibreChat
Übersicht
Für wen ist diese Seite? Fortgeschrittene Benutzer, die freihändig arbeiten oder die Barrierefreiheit verbessern möchten.
Was erwartet Sie? Lernen Sie beide Sprachfunktionen kennen: Sprechen statt Tippen (STT) und Antworten vorlesen lassen (TTS). Mit Vergleich Browser vs. externe Engine.
Hauptthemen auf dieser Seite:
Speech to Text (STT) - Spracheingabe aktivieren und nutzen
Text to Speech (TTS) - Sprachausgabe aktivieren und nutzen
Browser vs. Extern - Welche Engine ist besser? (Qualität und Funktionalität)
Hinweis: Für grundlegende Einstellungen siehe Benutzeroberfläche - Einstellungen - Speech.
Einfach erklärt: Mit diesen Funktionen können Sie mit LibreChat sprechen (statt zu schreiben) und sich Antworten anhören (statt zu lesen). Perfekt für Multitasking oder Barrierefreiheit.
Aktivierung und Nutzung
Speech to Text (Spracheingabe)
Aktivierung:
Öffnen Sie die Einstellungen (Benutzername unten links → Einstellungen)
Scrollen Sie zum Abschnitt „Speech“
Aktivieren Sie den Schalter bei „Speech to Text“
Wählen Sie eine Engine (Browser oder Extern)
Wählen Sie die Sprache (z.B. Deutsch, Englisch)
Nutzung im Chat:
Klicken Sie auf das Mikrofon-Symbol im Eingabefeld
Beginnen Sie zu sprechen
Ihre Worte werden automatisch in Text umgewandelt
Der Text erscheint im Eingabefeld
Senden Sie die Nachricht wie gewohnt ab
Text to Speech (Sprachausgabe)
Aktivierung:
Öffnen Sie die Einstellungen (Benutzername unten links → Einstellungen)
Scrollen Sie zum Abschnitt „Speech“
Aktivieren Sie den Schalter bei „Text to Speech“
Wählen Sie eine Engine (Browser oder Extern)
Wählen Sie eine Stimme
Nutzung im Chat:
Die KI hat eine Antwort geschrieben
Klicken Sie auf das Lautsprecher-Symbol unter der Nachricht
Die Nachricht wird vorgelesen
Browser vs. Externe Engine
Beide Funktionen (STT und TTS) bieten zwei Optionen:
Browser-Engine
Funktionsweise: Nutzt die eingebaute Sprachfunktionen Ihres Browsers (Web Speech API).
Vorteile:
Nachteile:
STT: Funktioniert nur, wenn Browser die Funktion unterstützt; Qualität hängt vom Browser ab; möglicherweise weniger genau
TTS: Stimmen können roboterhaft klingen; Qualität hängt vom Browser und Betriebssystem ab; weniger natürlich
Beispiel-Stimmen (TTS, Windows): Microsoft Hedda/Stefan - German (Germany)
Wann nutzen?: Für normale Nutzung, wenn Sie im Browser bleiben möchten.
Externe Engine (OpenAI)
Funktionsweise:
Vorteile:
STT: Sehr hohe Genauigkeit; funktioniert in allen Browsern; unterstützt viele Sprachen sehr gut; professionelle Spracherkennung
TTS: Sehr natürlich klingende Stimmen; hohe Qualität; professionelle Sprachausgabe; konsistent über alle Browser hinweg
Verfügbare Stimmen (TTS, OpenAI):
alloy: Neutral, ausgewogen
echo: Männlich, klar
fable: Britisch, angenehm
onyx: Tief, männlich
nova: Freundlich, weiblich
shimmer: Sanft, weiblich
Nachteile:
Leicht höhere Latenz
Verbraucht Ressourcen
Wann nutzen?: Wenn Sie höchste Genauigkeit (STT) oder natürlich klingende Stimmen (TTS) benötigen.