Natural Language Processing Group

«Wir verbinden Grundlagenforschung mit industriellen Anwendungen, um neue und innovative Produkte und Dienstleistungen hervorzubringen, während wir gleichzeitig die ethischen und gesellschaftlichen Dimensionen erforschen.»
Expertise

- Textanalytik
- Dialogsysteme
- Sprachverarbeitung
Das NLP-Forschungsteam entwickelt Technologien zur Analyse, zum Verständnis und zur Generierung von Sprache und Texten. Wir verbinden Methoden aus der Linguistik, dem Natural Language Processing (NLP) und der künstlichen Intelligenz, um eine natürlichsprachliche Kommunikation zwischen Mensch und Maschine zu ermöglichen. In unserer Forschung arbeiten wir an Themen wie der Textklassifikation (z. B. Sentiment-Analyse), Chatbots und Dialogsystemen, Textzusammenfassung, Speech-to-Text, Sprecherunterscheidung sowie der Generierung von natürlicher Sprache (Natural Language Generation). Die schweizerdeutsche Sprach- und Textverarbeitung bildet einen besonderen Schwerpunkt der Gruppe.
Angebote
- Einblick: Keynotes, Trainings
- KI-Beratung: Workshops, Expertenunterstützung, Beratung, Technikfolgenabschätzung
- Forschung und Entwicklung: kleine bis grosse Gemeinschaftsprojekte, Drittmittelforschung, studentische Projekte, praxiserprobte Prototypen
Team
Projekte
-
Talkalyzer
Erkennung von Rede-Anteilen mittels Sprecher-Erkennung in Echtzeit
abgeschlossen, 05/2013 - 11/2014
-
DeepText: Intelligente Textanalyse mit Deep Learning
DeepText entwickelt ein Software-Framework, mit dem automatisch Texte analysiert werden können, um wichtige Informationen zu extrahieren. Das Framework basiert auf modernen Algorithmen aus dem Maschinellen Lernen (Deep Learning), die Texte besser analysieren können als traditionelle Methoden. Damit…
abgeschlossen, 09/2016 - 02/2018
-
Digitale Kommunikationsstrategien für den Kultursektor in der Bodenseeregion
In Kooperation mit der FH Vorarlberg und dem ZHAW Institut für Angewandte Informationstechnologie untersucht das Zentrum für Kulturmanagement, wie eine Kommunikationsstrategie zur Vermarktung und Vermittlung der vielfältigen Kulturaktivitäten und -orte im Bodenseeraum zu gestalten wäre.Das Projekt…
abgeschlossen, 07/2018 - 06/2020
-
Evaluation automatische Spracherkennung (Schweizerdeutsch) für Menschen mit Schwerhörigkeit
Schriftdolmetschen ist eine Dienstleistung der Pro Audito für Schwerhörige/Hörbehinderte in verschiedensten Alltagssituationen. Ca. 100 Einsätze monatlich werden den Mitgliedern vermittelt, das Interesse ist aber viel grösser. Deshalb möchten wir evaluieren, inwieweit automatische Spracherkennung…
abgeschlossen, 09/2021 - 06/2022
-
Virtual Kids - Virtuelle Charaktere zur Verbesserung der Qualität von Kindesbefragungen
Werden Kinder in Ermittlungsverfahren zu eigenen, strafrechtlich relevanten Erlebnissen oder Beobachtungen befragt, hängt es entscheidend von der Qualität der Befragung ab, ob deren Aussagen im Strafverfahren verwertbar sind bzw. ob auf dieser Grundlage Entscheidungen getroffen werden und…
abgeschlossen, 04/2020 - 04/2024
-
Natural Language Processing for Tumor Classification (NLP4TC)
Eingangs-, Entladungs-, Radiologie- und Pathologieberichte und andere klinische Dokumente sind wertvolle Ressourcen, die für Erfolge in der Präzisionsmedizin verwendet werden können. Sie werden aber typischerweise in einem Freitextformat gespeichert, es wird nur wenig Struktur vorgegeben und die…
abgeschlossen, 05/2018 - 12/2019
-
Pre-Study on Generation of Hockey News
Tamedia möchte ein Softwaresystem entwickeln, das aus Hockeyspiel-Daten automatisch News-Artikel generiert.Die ZHAW wird die verschiedenen State-of-the-Art-Technologien untersuchen um die Machbarkeit der Entwicklung eines natürlichen Sprachsystems zu bewerten, das einen umfassenden kontextuellen…
abgeschlossen, 10/2018 - 12/2019
-
AI für sich selbst-organisierende Content Plattform (AI4CP)
In dieser Vorstudie soll ein Prototyp entwickelt werden, der aus dem Text einer Website oder eines Blog-Posts einen Vorschlag für einen Content-Post für die Conteo-Plattform erstellt. Dieser Prototyp soll vollautomatisch arbeiten, einen Text in vorgegebener Länge und Struktur erzeugen und den Post…
abgeschlossen, 05/2023 - 11/2023
-
Towards a Voice-Based Chatbot for Language Learners (ChaLL) (ChaLL)
Wir entwickeln ChaLL, den Prototypen eines sprachbasierten Chatbots. ChaLL bietet Sprachlerner:innen die Möglichkeit, das Sprechen in verschiedene aufgabenbasierten Konversationen zu üben und Feedback zu erhalten, frei von den zeitlichen Beschränkungen und dem Stress des klassischen Umfeldes im…
abgeschlossen, 02/2023 - 07/2024
-
NLP Community Building (ComBi)
SwissNLP möchte in einer konzertierten Aktion die Schweizer Akteure aus Industrie, Wissenschaft und Administration im Bereich Natural Language Processing (NLP) besser vernetzen. Dazu sollen bis Ende 2025 verschiedene Aktivitäten durchgeführt werden, um dieses Ziel zu erreichen (z.B. Expert Group…
laufend, 12/2023 - 01/2026
-
AUGEST - Automatische Generierung von Regressionstests
Wir untersuchen wie man neuen Protokollierungs-Tools für Java-Programme einsetzen kann, um automatisch Regressions-Testdaten und Regressionstests für produktive System zu erzeugen. Dadurch soll beim Refactoring von Software das Risiko und der Aufwand minimiert werden. Kernpunkte des Projektes sind:…
abgeschlossen, 08/2014 - 12/2015
-
Financial Demands of Swiss Municipalities
In this project, the goal was to discover Swiss municipalities that might have a need for a credit. Project partner was a large financial service provider who gives credits to public institutions and organizations. To optimize their sales efforts, they wanted to develop a software system that…
abgeschlossen, 09/2015 - 12/2018
-
Skalieren von Kundeninteraktionen mit einem Community Management Cockpit
Beekeeper ist ein Schweizer Anbieter von Cloud-Lösungen zur Realisierung von Kunden-Communities innerhalb von Smartphone-Applikationen (""Apps"") und Webseiten. Neben der rein technischen Lösung bietet Beekeeper auch Unterstützung im Aufbau von Kunden-Communities in Form von…
abgeschlossen, 09/2014 - 05/2016
-
Feasibility Study on Automated Email Assistants
We analyse the feasibility of a personal assistant email that would reduce the number of e-mails that we need to read, reply, and forward every day. Goal would be to reduce the amount by up to 50%. The personal assistant system should be able to make decision like: Could I forward directly this…
abgeschlossen, 07/2016 - 12/2016
-
Libra: A One-Tool Solution for MLD4 Compliance
Compared with earlier regulations, the 4th European Money Laundering Directive (MLD4) imposes rigorously increased requirements. It compels obliged entities to conduct in depth screenings of customers and their associations. The Libra Project aims at providing a one tool solution for meeting MLD4…
abgeschlossen, 09/2016 - 05/2019
-
SCAI – Smart Contract Analytics using Artificial Intelligence
Im SCAI-Projekt untersuchen die ZHAW und die Firma legartis, wie Inhalte von Verträgen automatisch juristisch ausgewertet und bewertet werden können. Dabei kommen Verfahren aus den Bereichen Natural Language Processing und Deep Learning zum Einsatz.
abgeschlossen, 05/2018 - 05/2020
-
LIHLITH – Learning to Interact with Humans by Lifelong Interaction with Humans
The LIHLITH project is a fundamental pilot research project which introduces a new lifelong learning framework for the interaction of humans and machines on specific domains. A Lifelong Learning system learns different tasks sequentially, over time, getting better at solving future related tasks…
abgeschlossen, 10/2017 - 12/2020
-
Call-E – Virtual Call Agent
The industrial project partner offers online brokering of loans, mortgages and insurances. The brokering process involves several phone calls of a call agent with a potential client. This is time-consuming and highly repetitive. For this reason, we want to develop a dialogue system which can take…
abgeschlossen, 06/2018 - 05/2020
-
Placebook – An Innovative Parking Space Spot Market
Das Sonderprojekt „placebook“ soll die beim InIT und IDP sowie bei der Studiengangleitung „Verkehrssysteme“ vorhandene Expertise erstmalig koordiniert zusammenführen, um in der stark an Bedeutung gewinnenden Mobilitätsproblematik „Parkieren“ einen organisatorisch-technisch herausragenden…
abgeschlossen, 02/2014 - 02/2015
-
PRISM: Predicting Radicalization Events in Social Media User Timelines
Das PRISM-Projekt konzentriert sich auf die Erkennung von Radikalisierungsereignissen in Social-Media-Netzwerken. Insgesamt sind wir daran interessiert, die Mechanismen aufzudecken, die dazu führen, dass extremistische Ideologie übertragen und in die Weltanschauung eines Social-Media-Nutzers oder…
abgeschlossen, 04/2022 - 02/2023
Publikationen
-
von Däniken, Pius; Grubenmann, Ralf; Cieliebak, Mark,
2018.
Word unigram weighing for author profiling at PAN 2018 : notebook for PAN at CLEF 2018[Poster].
In:
CLEF 2018 Evaluation Labs and Workshop – Working Notes Papers (PAN).
Conference and Labs of the Evaluation Forum (CLEF 2018), Avignon, France, 10-14 September 2018.
Verfügbar unter: http://ceur-ws.org/Vol-2125/paper_135.pdf
-
Cieliebak, Mark; Deriu, Jan Milan; Egger, Dominic; Uzdilli, Fatih,
2017.
A Twitter corpus and benchmark resources for german sentiment analysis[Paper].
In:
5th International Workshop on Natural Language Processing for Social Media, Boston MA, USA, 11 December 2017.
Association for Computational Linguistics.
S. 45-51.
Verfügbar unter: https://doi.org/10.18653/v1/W17-1106
-
Kodiyan, Don; Hardegger, Florin; Neuhaus, Stephan; Cieliebak, Mark,
2017.
Author profiling with bidirectional RNNs using attention with GRUs : notebook for PAN at CLEF 2017[Paper].
In:
CLEF 2017 Evaluation Labs and Workshop – Working Notes Papers.
CLEF 2017 Conference and Labs of the Evaluation Forum, Dublin, Ireland, 11-14 September 2017.
RWTH Aachen.
Verfügbar unter: https://doi.org/10.21256/zhaw-1531
-
Deriu, Jan Milan; Cieliebak, Mark,
2017.
End-to-end trainable system for enhancing diversity in natural language generation[Paper].
In:
End-to-End Natural Language Generation Challenge (E2E NLG), 2017.
ZHAW Zürcher Hochschule für Angewandte Wissenschaften.
Verfügbar unter: https://doi.org/10.21256/zhaw-4889
-
Graf, Hans Daniel; Koc, Yusuf; Panighetti, Sandro; Togni, Matteo; von Grünigen, Dirk; Weilenmann, Martin; Xhoxhaj, Erland; Zürrer, Daniel; Benites de Azevedo e Souza, Fernando; Deriu, Jan Milan; Neureiter, Nico; von Däniken, Pius; Cieliebak, Mark; Eich, Walter; Neuhaus, Stephan; Stockinger, Kurt,
2017.
Four different ways to build a chatbot about movies[Poster].
In:
SwissText 2017: 2nd Swiss Text Analytics Conference, Winterthur, 9. Juni 2017.