Sprach-Ein- und Ausgabe in LibreChat

Ziel dieser Seite: Dieses Kapitel vertieft die Speech-Funktionen. Für UI-Schritte siehe Benutzeroberfläche verstehen, für Upload/Workflow-Kombinationen Erweiterte Funktionen nutzen, und bei Problemen hilft der Abschnitt „Sprachfunktionen„ in der Häufig gestellte Fragen (FAQ).

Übersicht

Für wen ist diese Seite? Fortgeschrittene Benutzer, die freihändig arbeiten oder die Barrierefreiheit verbessern möchten.

Was erwartet Sie? Lernen Sie beide Sprachfunktionen kennen: Sprechen statt Tippen (STT) und Antworten vorlesen lassen (TTS). Mit Vergleich Browser vs. externe Engine.

Hauptthemen auf dieser Seite:

Speech to Text (STT) - Spracheingabe aktivieren und nutzen
Text to Speech (TTS) - Sprachausgabe aktivieren und nutzen
Browser vs. Extern - Welche Engine ist besser? (Qualität und Funktionalität)

Hinweis: Für grundlegende Einstellungen siehe Benutzeroberfläche - Einstellungen - Speech.

Einfach erklärt: Mit diesen Funktionen können Sie mit LibreChat sprechen (statt zu schreiben) und sich Antworten anhören (statt zu lesen). Perfekt für Multitasking oder Barrierefreiheit.

Aktivierung und Nutzung

Einstellungen öffnen: Siehe Benutzeroberfläche - Einstellungen - Speech.

Speech to Text (Spracheingabe)

Aktivierung:

Öffnen Sie die Einstellungen (Benutzername unten links → Einstellungen)
Scrollen Sie zum Abschnitt „Speech“
Aktivieren Sie den Schalter bei „Speech to Text“
Wählen Sie eine Engine (Browser oder Extern)
Wählen Sie die Sprache (z.B. Deutsch, Englisch)

Nutzung im Chat:

Klicken Sie auf das Mikrofon-Symbol im Eingabefeld
Beginnen Sie zu sprechen
Ihre Worte werden automatisch in Text umgewandelt
Der Text erscheint im Eingabefeld
Senden Sie die Nachricht wie gewohnt ab

Text to Speech (Sprachausgabe)

Aktivierung:

Öffnen Sie die Einstellungen (Benutzername unten links → Einstellungen)
Scrollen Sie zum Abschnitt „Speech“
Aktivieren Sie den Schalter bei „Text to Speech“
Wählen Sie eine Engine (Browser oder Extern)
Wählen Sie eine Stimme

Nutzung im Chat:

Die KI hat eine Antwort geschrieben
Klicken Sie auf das Lautsprecher-Symbol unter der Nachricht
Die Nachricht wird vorgelesen

Browser vs. Externe Engine

Beide Funktionen (STT und TTS) bieten zwei Optionen:

Browser-Engine

Funktionsweise: Nutzt die eingebaute Sprachfunktionen Ihres Browsers (Web Speech API).

Vorteile:

Funktioniert direkt im Browser
Keine zusätzlichen Kosten
Schnell
Verarbeitet lokal

Nachteile:

STT: Funktioniert nur, wenn Browser die Funktion unterstützt; Qualität hängt vom Browser ab; möglicherweise weniger genau
TTS: Stimmen können roboterhaft klingen; Qualität hängt vom Browser und Betriebssystem ab; weniger natürlich

Beispiel-Stimmen (TTS, Windows): Microsoft Hedda/Stefan - German (Germany)

Wann nutzen?: Für normale Nutzung, wenn Sie im Browser bleiben möchten.

Externe Engine (OpenAI)

Funktionsweise:

STT: Leitet Audiodaten an den Whisper-Dienst von OpenAI weiter
TTS: Nutzt die professionelle Text-to-Speech-Engine von OpenAI

Vorteile:

STT: Sehr hohe Genauigkeit; funktioniert in allen Browsern; unterstützt viele Sprachen sehr gut; professionelle Spracherkennung
TTS: Sehr natürlich klingende Stimmen; hohe Qualität; professionelle Sprachausgabe; konsistent über alle Browser hinweg

Verfügbare Stimmen (TTS, OpenAI):

alloy: Neutral, ausgewogen
echo: Männlich, klar
fable: Britisch, angenehm
onyx: Tief, männlich
nova: Freundlich, weiblich
shimmer: Sanft, weiblich

Nachteile:

Leicht höhere Latenz
Verbraucht Ressourcen

Wann nutzen?: Wenn Sie höchste Genauigkeit (STT) oder natürlich klingende Stimmen (TTS) benötigen.

Weitere Informationen

← Zurück zur Startseite