Eingabe löschen

Kopfbereich

Schnellnavigation

Hauptnavigation

End-to-End Low-Resource Speech Translation for Swiss German Dialects

Auf einen Blick

Beschreibung

Dieses Projekt untersucht die Anwendung der neuesten Erkenntnisse in der Sprachübersetzung auf Schweizerdeutsch. Sprachübersetzung (ST) ist die Aufgabe, gesprochene Äußerungen in einer Sprache in einen schriftlichen Text in einer anderen Sprache. Sie dient als wesentliches Instrument zurSprachbarrieren in verschiedenen Kommunikationsumgebungen zu überwinden und ein vielversprechendes
Mittel zur Erhaltung bedrohter Sprachen.

Wir werden untersuchen, wie ST auf schweizerdeutsche Dialekte angewandt werden kann, d.h. zur Übersetzung von Sprache in Schweizerdeutsch in Text in Standarddeutsch zu übersetzen. Dies hat zahlreiche wichtige Anwendungen in der Praxis, z.B. Sprachroboter wie Siri oder Alexa, Transkription von Interviews, Erstellung von Besprechungsprotokollen, Auswertung von Call-Center-Dialogen, etc. Die Grundidee für die Transkription ins Standarddeutsche ist, dass dadurch eine einheitliche Schriftform geschaffen wird
eine einheitliche Schriftform bietet und es uns ermöglicht, von der Fülle an NLP-Methoden zu profitieren, die es für Standarddeutsch als einer gut untersuchten Sprache mit vielen Ressourcen (z. B. Part-of-Speech-Tagging, Named Entity Recognition, Sentimentanalyse, Zusammenfassung usw.).

ST ist ein attraktiver Ansatz für Schweizerdeutsch, da er nicht auf eine textuelle Zwischenrepräsentation in der Ausgangssprache angewiesen ist (es gibt keine
einheitliche Schriftform für Schweizerdeutsch gibt). Allerdings erfordert er normalerweise eine große Menge an annotierte Trainingsdaten, die für die zahlreichen schweizerdeutschen Dialekte nicht verfügbar sind. Aus diesem Grund werden wir untersuchen, wie ST-Systeme für schweizerdeutsche Dialekte aufgebaut werden können, ohne dass für jeden Dialekt annotierte Daten erzeugt werden müssen. Genauer gesagt, werden wir

1. ein umfangreiches parallelen Korpus von 450 Stunden Audio in 7 wichtigen Schweizer Dialekten erstellen und den entsprechenden Übersetzungen in Standarddeutschem Text. Dieser Korpus wird in einer kontrollierten Umgebung erstellt, so dass er für wissenschaftlich fundierte Experimente zu schweizerdeutschen Dialekten genutzt werden kann.

2. Implementierung von 3 ST-Systemen und Durchführung von Experimenten zum optimalen Training eines ST System für verschiedene Dialekte

3. Untersuchen, wie man Trainingsdaten zwischen verschiedenen Dialekten des Schweizerdeutschen übertragen kann, z.B. mit Hilfe von Speech-to-Speech-Übersetzung, Vokabelerweiterung und Stimmanpassung, um den Mangel an Trainingsdaten für die meisten schweizerdeutschen Dialekte zu mildern.

4. Eine Sammlung von Empfehlungen und Best Practices für die Entwicklung von allgemeinen ST-Systeme für schweizerdeutsche Dialekte.

Die Ergebnisse dieses Projekts werden den Weg für die Entwicklung praktischer ST-Lösungen für Schweizerdeutsch auf breiter Ebene und tragen zur Verbreitung des Schweizerdeutschen als Teil des kulturellen Erbes der Schweiz im digitalen Zeitalter.