Natural Language Processing Group

«Wir verbinden Grundlagenforschung mit industriellen Anwendungen, um neue und innovative Produkte und Dienstleistungen hervorzubringen, während wir gleichzeitig die ethischen und gesellschaftlichen Dimensionen erforschen.»
Expertise

- Textanalytik
- Dialogsysteme
- Sprachverarbeitung
Das NLP-Forschungsteam entwickelt Technologien zur Analyse, zum Verständnis und zur Generierung von Sprache und Texten. Wir verbinden Methoden aus der Linguistik, dem Natural Language Processing (NLP) und der künstlichen Intelligenz, um eine natürlichsprachliche Kommunikation zwischen Mensch und Maschine zu ermöglichen. In unserer Forschung arbeiten wir an Themen wie der Textklassifikation (z. B. Sentiment-Analyse), Chatbots und Dialogsystemen, Textzusammenfassung, Speech-to-Text, Sprecherunterscheidung sowie der Generierung von natürlicher Sprache (Natural Language Generation). Die schweizerdeutsche Sprach- und Textverarbeitung bildet einen besonderen Schwerpunkt der Gruppe.
Angebote
- Einblick: Keynotes, Trainings
- KI-Beratung: Workshops, Expertenunterstützung, Beratung, Technikfolgenabschätzung
- Forschung und Entwicklung: kleine bis grosse Gemeinschaftsprojekte, Drittmittelforschung, studentische Projekte, praxiserprobte Prototypen
Team
Projekte
-
Talkalyzer
Erkennung von Rede-Anteilen mittels Sprecher-Erkennung in Echtzeit
abgeschlossen, 05/2013 - 11/2014
-
DeepText: Intelligente Textanalyse mit Deep Learning
DeepText entwickelt ein Software-Framework, mit dem automatisch Texte analysiert werden können, um wichtige Informationen zu extrahieren. Das Framework basiert auf modernen Algorithmen aus dem Maschinellen Lernen (Deep Learning), die Texte besser analysieren können als traditionelle Methoden. Damit…
abgeschlossen, 09/2016 - 02/2018
-
Digitale Kommunikationsstrategien für den Kultursektor in der Bodenseeregion
In Kooperation mit der FH Vorarlberg und dem ZHAW Institut für Angewandte Informationstechnologie untersucht das Zentrum für Kulturmanagement, wie eine Kommunikationsstrategie zur Vermarktung und Vermittlung der vielfältigen Kulturaktivitäten und -orte im Bodenseeraum zu gestalten wäre.Das Projekt…
abgeschlossen, 07/2018 - 06/2020
-
Evaluation automatische Spracherkennung (Schweizerdeutsch) für Menschen mit Schwerhörigkeit
Schriftdolmetschen ist eine Dienstleistung der Pro Audito für Schwerhörige/Hörbehinderte in verschiedensten Alltagssituationen. Ca. 100 Einsätze monatlich werden den Mitgliedern vermittelt, das Interesse ist aber viel grösser. Deshalb möchten wir evaluieren, inwieweit automatische Spracherkennung…
abgeschlossen, 09/2021 - 06/2022
-
Virtual Kids - Virtuelle Charaktere zur Verbesserung der Qualität von Kindesbefragungen
Werden Kinder in Ermittlungsverfahren zu eigenen, strafrechtlich relevanten Erlebnissen oder Beobachtungen befragt, hängt es entscheidend von der Qualität der Befragung ab, ob deren Aussagen im Strafverfahren verwertbar sind bzw. ob auf dieser Grundlage Entscheidungen getroffen werden und…
abgeschlossen, 04/2020 - 04/2024
-
Natural Language Processing for Tumor Classification (NLP4TC)
Eingangs-, Entladungs-, Radiologie- und Pathologieberichte und andere klinische Dokumente sind wertvolle Ressourcen, die für Erfolge in der Präzisionsmedizin verwendet werden können. Sie werden aber typischerweise in einem Freitextformat gespeichert, es wird nur wenig Struktur vorgegeben und die…
abgeschlossen, 05/2018 - 12/2019
-
Pre-Study on Generation of Hockey News
Tamedia möchte ein Softwaresystem entwickeln, das aus Hockeyspiel-Daten automatisch News-Artikel generiert.Die ZHAW wird die verschiedenen State-of-the-Art-Technologien untersuchen um die Machbarkeit der Entwicklung eines natürlichen Sprachsystems zu bewerten, das einen umfassenden kontextuellen…
abgeschlossen, 10/2018 - 12/2019
-
AI für sich selbst-organisierende Content Plattform (AI4CP)
In dieser Vorstudie soll ein Prototyp entwickelt werden, der aus dem Text einer Website oder eines Blog-Posts einen Vorschlag für einen Content-Post für die Conteo-Plattform erstellt. Dieser Prototyp soll vollautomatisch arbeiten, einen Text in vorgegebener Länge und Struktur erzeugen und den Post…
abgeschlossen, 05/2023 - 11/2023
-
Towards a Voice-Based Chatbot for Language Learners (ChaLL) (ChaLL)
Wir entwickeln ChaLL, den Prototypen eines sprachbasierten Chatbots. ChaLL bietet Sprachlerner:innen die Möglichkeit, das Sprechen in verschiedene aufgabenbasierten Konversationen zu üben und Feedback zu erhalten, frei von den zeitlichen Beschränkungen und dem Stress des klassischen Umfeldes im…
abgeschlossen, 02/2023 - 07/2024
-
NLP Community Building (ComBi)
SwissNLP möchte in einer konzertierten Aktion die Schweizer Akteure aus Industrie, Wissenschaft und Administration im Bereich Natural Language Processing (NLP) besser vernetzen. Dazu sollen bis Ende 2025 verschiedene Aktivitäten durchgeführt werden, um dieses Ziel zu erreichen (z.B. Expert Group…
laufend, 12/2023 - 01/2026
-
AUGEST - Automatische Generierung von Regressionstests
Wir untersuchen wie man neuen Protokollierungs-Tools für Java-Programme einsetzen kann, um automatisch Regressions-Testdaten und Regressionstests für produktive System zu erzeugen. Dadurch soll beim Refactoring von Software das Risiko und der Aufwand minimiert werden. Kernpunkte des Projektes sind:…
abgeschlossen, 08/2014 - 12/2015
-
Financial Demands of Swiss Municipalities
In this project, the goal was to discover Swiss municipalities that might have a need for a credit. Project partner was a large financial service provider who gives credits to public institutions and organizations. To optimize their sales efforts, they wanted to develop a software system that…
abgeschlossen, 09/2015 - 12/2018
-
Skalieren von Kundeninteraktionen mit einem Community Management Cockpit
Beekeeper ist ein Schweizer Anbieter von Cloud-Lösungen zur Realisierung von Kunden-Communities innerhalb von Smartphone-Applikationen (""Apps"") und Webseiten. Neben der rein technischen Lösung bietet Beekeeper auch Unterstützung im Aufbau von Kunden-Communities in Form von…
abgeschlossen, 09/2014 - 05/2016
-
Feasibility Study on Automated Email Assistants
We analyse the feasibility of a personal assistant email that would reduce the number of e-mails that we need to read, reply, and forward every day. Goal would be to reduce the amount by up to 50%. The personal assistant system should be able to make decision like: Could I forward directly this…
abgeschlossen, 07/2016 - 12/2016
-
Libra: A One-Tool Solution for MLD4 Compliance
Compared with earlier regulations, the 4th European Money Laundering Directive (MLD4) imposes rigorously increased requirements. It compels obliged entities to conduct in depth screenings of customers and their associations. The Libra Project aims at providing a one tool solution for meeting MLD4…
abgeschlossen, 09/2016 - 05/2019
-
SCAI – Smart Contract Analytics using Artificial Intelligence
Im SCAI-Projekt untersuchen die ZHAW und die Firma legartis, wie Inhalte von Verträgen automatisch juristisch ausgewertet und bewertet werden können. Dabei kommen Verfahren aus den Bereichen Natural Language Processing und Deep Learning zum Einsatz.
abgeschlossen, 05/2018 - 05/2020
-
LIHLITH – Learning to Interact with Humans by Lifelong Interaction with Humans
The LIHLITH project is a fundamental pilot research project which introduces a new lifelong learning framework for the interaction of humans and machines on specific domains. A Lifelong Learning system learns different tasks sequentially, over time, getting better at solving future related tasks…
abgeschlossen, 10/2017 - 12/2020
-
Call-E – Virtual Call Agent
The industrial project partner offers online brokering of loans, mortgages and insurances. The brokering process involves several phone calls of a call agent with a potential client. This is time-consuming and highly repetitive. For this reason, we want to develop a dialogue system which can take…
abgeschlossen, 06/2018 - 05/2020
-
Placebook – An Innovative Parking Space Spot Market
Das Sonderprojekt „placebook“ soll die beim InIT und IDP sowie bei der Studiengangleitung „Verkehrssysteme“ vorhandene Expertise erstmalig koordiniert zusammenführen, um in der stark an Bedeutung gewinnenden Mobilitätsproblematik „Parkieren“ einen organisatorisch-technisch herausragenden…
abgeschlossen, 02/2014 - 02/2015
-
PRISM: Predicting Radicalization Events in Social Media User Timelines
Das PRISM-Projekt konzentriert sich auf die Erkennung von Radikalisierungsereignissen in Social-Media-Netzwerken. Insgesamt sind wir daran interessiert, die Mechanismen aufzudecken, die dazu führen, dass extremistische Ideologie übertragen und in die Weltanschauung eines Social-Media-Nutzers oder…
abgeschlossen, 04/2022 - 02/2023
Publikationen
-
Stadelmann, Thilo; Amirian, Mohammadreza; Arabaci, Ismail; Arnold, Marek; Duivesteijn, Gilbert François; Elezi, Ismail; Geiger, Melanie; Lörwald, Stefan; Meier, Benjamin Bruno; Rombach, Katharina; Tuggener, Lukas,
2018.
Deep learning in the wild[Paper].
In:
Artificial Neural Networks in Pattern Recognition.
8th IAPR TC3 Workshop on Artificial Neural Networks in Pattern Recognition (ANNPR), Siena, Italy, 19-21 September 2018.
Springer.
S. 17-38.
Lecture Notes in Computer Science ; 11081.
Verfügbar unter: https://doi.org/10.1007/978-3-319-99978-4_2
-
Tuggener, Lukas; Elezi, Ismail; Schmidhuber, Jürgen; Stadelmann, Thilo,
2018.
Deep watershed detector for music object recognition[Paper].
In:
Proceedings of the 19th International Society for Music Information Retrieval Conference.
19th International Society for Music Information Retrieval Conference, Paris, 23-27 September 2018.
Paris:
Society for Music Information Retrieval.
Verfügbar unter: https://doi.org/10.21256/zhaw-3760
-
Tuggener, Lukas; Elezi, Ismail; Schmidhuber, Jürgen; Pelillo, Marcello; Stadelmann, Thilo,
2018.
DeepScores : a dataset for segmentation, detection and classification of tiny objects[Paper].
In:
2018 24th International Conference on Pattern Recognition (ICPR).
24th International Conference on Pattern Recognition (ICPR 2018), Beijing, China, 20-28 August 2018.
IEEE.
S. 1-6.
Verfügbar unter: https://doi.org/10.1109/ICPR.2018.8545307
-
Sugisaki, Kyoko; Tuggener, Don,
2018.
German compound splitting using the compound productivity of morphemes[Paper].
In:
Barbaresi, Adrien; Biber, Hanno; Neubarth, Friedrich; Osswald, Rainer, Hrsg.,
14th Conference on Natural Language Processing - KONVENS 2018.
14th Conference on Natural Language Processing (KONVENS 2018), Vienna, Austria, 19-21 September 2018.
Austrian Academy of Sciences Press.
S. 141-147.
Verfügbar unter: https://doi.org/10.21256/zhaw-4974
-
Agirre, Eneko; Marchand, Sarah; Rosset, Sophie; Peñas, Anselmo; Cieliebak, Mark,
2018.
LIHLITH : improving communication skills of robots through lifelong learning.
ERCIM News.
2018(114), S. 12.
Verfügbar unter: https://ercim-news.ercim.eu/images/stories/EN114/EN114-web.pdf