Benutzer-Werkzeuge

Webseiten-Werkzeuge


sonstige_dienste:ki-dienste:librechat:sprache

Sprach-Ein- und Ausgabe in LibreChat

← Zurück zur LibreChat-Menü

Ziel dieser Seite: Dieses Kapitel vertieft die Speech-Funktionen. Für UI-Schritte siehe Benutzeroberfläche verstehen, für Upload/Workflow-Kombinationen Erweiterte Funktionen nutzen, und bei Problemen hilft der Abschnitt „Sprachfunktionen„ in der Häufig gestellte Fragen (FAQ).

Übersicht

Für wen ist diese Seite? Fortgeschrittene Benutzer, die freihändig arbeiten oder die Barrierefreiheit verbessern möchten.

Was erwartet Sie? Lernen Sie beide Sprachfunktionen kennen: Sprechen statt Tippen (STT) und Antworten vorlesen lassen (TTS). Mit Vergleich Browser vs. externe Engine.

Hauptthemen auf dieser Seite:

  • Speech to Text (STT) - Spracheingabe aktivieren und nutzen
  • Text to Speech (TTS) - Sprachausgabe aktivieren und nutzen
  • Browser vs. Extern - Welche Engine ist besser? (Qualität und Funktionalität)

Hinweis: Für grundlegende Einstellungen siehe Benutzeroberfläche - Einstellungen - Speech.

Einfach erklärt: Mit diesen Funktionen können Sie mit LibreChat sprechen (statt zu schreiben) und sich Antworten anhören (statt zu lesen). Perfekt für Multitasking oder Barrierefreiheit.

Aktivierung und Nutzung

Einstellungen öffnen: Siehe Benutzeroberfläche - Einstellungen - Speech.

Speech to Text (Spracheingabe)

Aktivierung:

  1. Öffnen Sie die Einstellungen (Benutzername unten links → Einstellungen)
  2. Scrollen Sie zum Abschnitt „Speech“
  3. Aktivieren Sie den Schalter bei „Speech to Text“
  4. Wählen Sie eine Engine (Browser oder Extern)
  5. Wählen Sie die Sprache (z.B. Deutsch, Englisch)

Nutzung im Chat:

  1. Klicken Sie auf das Mikrofon-Symbol im Eingabefeld
  2. Beginnen Sie zu sprechen
  3. Ihre Worte werden automatisch in Text umgewandelt
  4. Der Text erscheint im Eingabefeld
  5. Senden Sie die Nachricht wie gewohnt ab

Text to Speech (Sprachausgabe)

Aktivierung:

  1. Öffnen Sie die Einstellungen (Benutzername unten links → Einstellungen)
  2. Scrollen Sie zum Abschnitt „Speech“
  3. Aktivieren Sie den Schalter bei „Text to Speech“
  4. Wählen Sie eine Engine (Browser oder Extern)
  5. Wählen Sie eine Stimme

Nutzung im Chat:

  1. Die KI hat eine Antwort geschrieben
  2. Klicken Sie auf das Lautsprecher-Symbol unter der Nachricht
  3. Die Nachricht wird vorgelesen

Browser vs. Externe Engine

Beide Funktionen (STT und TTS) bieten zwei Optionen:

Browser-Engine

Funktionsweise: Nutzt die eingebaute Sprachfunktionen Ihres Browsers (Web Speech API).

Vorteile:

  • Funktioniert direkt im Browser
  • Keine zusätzlichen Kosten
  • Schnell
  • Verarbeitet lokal

Nachteile:

  • STT: Funktioniert nur, wenn Browser die Funktion unterstützt; Qualität hängt vom Browser ab; möglicherweise weniger genau
  • TTS: Stimmen können roboterhaft klingen; Qualität hängt vom Browser und Betriebssystem ab; weniger natürlich

Beispiel-Stimmen (TTS, Windows): Microsoft Hedda/Stefan - German (Germany)

Wann nutzen?: Für normale Nutzung, wenn Sie im Browser bleiben möchten.

Externe Engine (OpenAI)

Funktionsweise:

  • STT: Leitet Audiodaten an den Whisper-Dienst von OpenAI weiter
  • TTS: Nutzt die professionelle Text-to-Speech-Engine von OpenAI

Vorteile:

  • STT: Sehr hohe Genauigkeit; funktioniert in allen Browsern; unterstützt viele Sprachen sehr gut; professionelle Spracherkennung
  • TTS: Sehr natürlich klingende Stimmen; hohe Qualität; professionelle Sprachausgabe; konsistent über alle Browser hinweg

Verfügbare Stimmen (TTS, OpenAI):

  • alloy: Neutral, ausgewogen
  • echo: Männlich, klar
  • fable: Britisch, angenehm
  • onyx: Tief, männlich
  • nova: Freundlich, weiblich
  • shimmer: Sanft, weiblich

Nachteile:

  • Leicht höhere Latenz
  • Verbraucht Ressourcen

Wann nutzen?: Wenn Sie höchste Genauigkeit (STT) oder natürlich klingende Stimmen (TTS) benötigen.

Weitere Informationen

sonstige_dienste/ki-dienste/librechat/sprache.txt · Zuletzt geändert: von Huichen Shu

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki