Eingabe löschen

Hauptnavigation

Automatische Sprachverarbeitung in Schweizerdeutsch für Personen mit Sprachstörungen (SpeeDi)

Wir werden Sprachtechnologien für unvollkommenes Schweizerdeutsch entwickeln. Diese Technologien sind entscheidend für die Entwicklung von KI-Anwendungen für Menschen mit Sprachstörungen, z. B. Chatbots für Kinder in der Sprachtherapie oder Diagnosetools für Patienten mit Parkinson.

Beschreibung

Eine gängige Anwendung von KI in der Sprachtherapie sind Chatbots, mit denen Patient:innen das Sprechen üben können. Ihre Antworten lassen sich analysieren, um Sprachfortschritte zu verfolgen oder Störungen zu diagnostizieren (z. B. frühe Parkinson-Symptome). Für solche Tools sind vier Komponenten erforderlich:

  1. Speech-to-Text (STT): Wandelt die Sprache des Patienten in Text um, in der Regel in Standarddeutsch.
  2. Large Language Model (LLM): Erzeugt intelligente Antworten auf die STT-Ausgabe.
  3. Text-to-Speech (TTS): Wandelt Antworten in Standarddeutsch-Audio um.
  4. Fehleranalyse: Identifiziert Sprachfehler und ungewöhnliche Formulierungen.

Während STT, LLM und TTS für SG bereits existieren, gibt es noch kein Fehleranalysesystem.

Unser Projekt konzentriert sich auf:

  • Fehlererhaltende STT (EP-STT-SG): Transkribiert SG-Audio in SG-Text und bewahrt dabei Sprachfehler – im Gegensatz zu
    „normaler“ STT, die üblicherweise in Standarddeutsch-Text transkribiert und Sprachfehler glättet.
  • Fehleranalyse: Erkennt Sprachfehler und sprachliche Anomalien in den EP-STT-SG-Ausgaben

Darüber hinaus werden wir unsere bestehenden STT- und TTS-Modelle für SG verfeinern und optimieren und alle Ressourcen für
Forschungs- und Nicht-Forschungszwecke zur Verfügung stellen.

 

Eckdaten

Projektleitung

Projektstatus

Start bevorstehend, 06/2026

Institut/Zentrum

Centre for Artificial Intelligence (CAI)

Drittmittelgeber

Digitalisierungsinitiative der Zürcher Hochschulen DIZH; ZHAW digital / Senior Fellowship with "Extended Scope"

Projektvolumen

296'505 CHF