Natural Language Processing Group

«Wir verbinden Grundlagenforschung mit industriellen Anwendungen, um neue und innovative Produkte und Dienstleistungen hervorzubringen, während wir gleichzeitig die ethischen und gesellschaftlichen Dimensionen erforschen.»
Expertise

- Textanalytik
- Dialogsysteme
- Sprachverarbeitung
Das NLP-Forschungsteam entwickelt Technologien zur Analyse, zum Verständnis und zur Generierung von Sprache und Texten. Wir verbinden Methoden aus der Linguistik, dem Natural Language Processing (NLP) und der künstlichen Intelligenz, um eine natürlichsprachliche Kommunikation zwischen Mensch und Maschine zu ermöglichen. In unserer Forschung arbeiten wir an Themen wie der Textklassifikation (z. B. Sentiment-Analyse), Chatbots und Dialogsystemen, Textzusammenfassung, Speech-to-Text, Sprecherunterscheidung sowie der Generierung von natürlicher Sprache (Natural Language Generation). Die schweizerdeutsche Sprach- und Textverarbeitung bildet einen besonderen Schwerpunkt der Gruppe.
Angebote
- Einblick: Keynotes, Trainings
- KI-Beratung: Workshops, Expertenunterstützung, Beratung, Technikfolgenabschätzung
- Forschung und Entwicklung: kleine bis grosse Gemeinschaftsprojekte, Drittmittelforschung, studentische Projekte, praxiserprobte Prototypen
Team
Projekte
-
Automatische Artikelsegmentierung von Zeitungsseiten für "Real Time Print Media Monitoring" (PANOPTES)
Das neue Produkt "Real Time Print Media Monitoring" von ARGUS DATA INSIGHTS Schweiz AG ist eine automatisierte Pipeline, die relevante Artikel in Printmedien identifiziert, extrahiert, und den Kunden in Echtzeit zustellt. Grundlage für das Produkt ist eine automatische Segmentierung von…
abgeschlossen, 07/2015 - 09/2017
-
Plattform “Sinn-im-Beruf”
Wir entwickeln eine digitale Plattform namens “Sinn-im-Beruf”, die Erwerbstätige dabei unterstützt, ihre Arbeit und berufliche Laufbahn sinnstiftend zu gestalten.
laufend, 03/2025 - 02/2028
-
Financial Demands of Swiss Municipalities
In this project, the goal was to discover Swiss municipalities that might have a need for a credit. Project partner was a large financial service provider who gives credits to public institutions and organizations. To optimize their sales efforts, they wanted to develop a software system that…
abgeschlossen, 09/2015 - 12/2018
-
Skalieren von Kundeninteraktionen mit einem Community Management Cockpit
Beekeeper ist ein Schweizer Anbieter von Cloud-Lösungen zur Realisierung von Kunden-Communities innerhalb von Smartphone-Applikationen (""Apps"") und Webseiten. Neben der rein technischen Lösung bietet Beekeeper auch Unterstützung im Aufbau von Kunden-Communities in Form von…
abgeschlossen, 09/2014 - 05/2016
-
AUGEST - Automatische Generierung von Regressionstests
Wir untersuchen wie man neuen Protokollierungs-Tools für Java-Programme einsetzen kann, um automatisch Regressions-Testdaten und Regressionstests für produktive System zu erzeugen. Dadurch soll beim Refactoring von Software das Risiko und der Aufwand minimiert werden. Kernpunkte des Projektes sind:…
abgeschlossen, 08/2014 - 12/2015
-
Feasibility Study on Automated Email Assistants
We analyse the feasibility of a personal assistant email that would reduce the number of e-mails that we need to read, reply, and forward every day. Goal would be to reduce the amount by up to 50%. The personal assistant system should be able to make decision like: Could I forward directly this…
abgeschlossen, 07/2016 - 12/2016
-
Talkalyzer
Erkennung von Rede-Anteilen mittels Sprecher-Erkennung in Echtzeit
abgeschlossen, 05/2013 - 11/2014
-
Libra: A One-Tool Solution for MLD4 Compliance
Compared with earlier regulations, the 4th European Money Laundering Directive (MLD4) imposes rigorously increased requirements. It compels obliged entities to conduct in depth screenings of customers and their associations. The Libra Project aims at providing a one tool solution for meeting MLD4…
abgeschlossen, 09/2016 - 05/2019
-
Natural Language Processing for Tumor Classification (NLP4TC)
Eingangs-, Entladungs-, Radiologie- und Pathologieberichte und andere klinische Dokumente sind wertvolle Ressourcen, die für Erfolge in der Präzisionsmedizin verwendet werden können. Sie werden aber typischerweise in einem Freitextformat gespeichert, es wird nur wenig Struktur vorgegeben und die…
abgeschlossen, 05/2018 - 12/2019
-
Pre-Study on Generation of Hockey News
Tamedia möchte ein Softwaresystem entwickeln, das aus Hockeyspiel-Daten automatisch News-Artikel generiert.Die ZHAW wird die verschiedenen State-of-the-Art-Technologien untersuchen um die Machbarkeit der Entwicklung eines natürlichen Sprachsystems zu bewerten, das einen umfassenden kontextuellen…
abgeschlossen, 10/2018 - 12/2019
-
AuSuM – Automatic Supply Chain Monitoring
The project implements an online service for companies to monitor suppliers for violations ofenvironmental, social, or governance norms. To do so, a vast variety of sources, such as news outlets, is monitored using machine learning and natural language processing with near human-level accuracy.
abgeschlossen, 12/2018 - 05/2021
-
SODES – Swiss Open Data Exploration System
In den letzten Jahren haben nationale und internationale Institutionen, Regierungen und NGOs große Datenmengen öffentlich zugänglich gemacht: Es gibt buchstäblich Tausende von offenen Datenquellen, mit Temperaturmessungen, Börsenkursen, Bevölkerungs- und Einkommensstatistiken etc. Die meisten…
abgeschlossen, 12/2013 - 07/2014
-
Didaktische Vergleichsstudie zwischen klassischem Unterricht und Flipped Classroom
Evaluation "Flipped Classroom"
abgeschlossen, 12/2013 - 12/2014
-
Speech-to-Text für Schweizerdeutsch
Im gemeinsamen. Forschungsprojekt «Speech-to-Text for Swiss German (STT4SG)» verfolgen die teilnehmenden Institutionen das Ziel, eine geeignete Datenbasis aufzubauen und damit eine Speech-to-Text Software-Lösung. zu entwickeln. Diese Lösung soll schweizerdeutsch (Dialekte) gesprochene Audios in…
abgeschlossen, 02/2021 - 02/2022
-
Crowdsourcing für Schweizerdeutsches Speech-to-Text
Die Verschriftlichung von gesprochenem Schweizerdeutsch (Speech-to-Text, STT) ist ein wichtiges Problem, das viele Firmen bei uns nachfragen. Anwendungen sind z.B. automatischer Kundensupport, Voice Assistants wie Siri, TV-Untertitelung, etc. Bisher existiert keine praxistaugliche Lösung, was vor…
abgeschlossen, 01/2021 - 06/2021
-
Swiss Text Analytics Conference 2021 (SwissText)
Die Swiss Text Analytics Conference (SwissText) findet seit 2016 jährlich statt und bringt Expertinnen und Experten der Textanalyse aus Industrie und Forschung zusammen. Das Programm besteht aus Keynote-Referaten von international bekannten Repräsentanten aus Forschung und Industrie,…
abgeschlossen, 12/2020 - 09/2021
-
DOSSMA – Erkennung von verdächtigem Verhalten in Social Media
Das Projekt DOSSMA wird verdächtiges und bösartiges Verhalten auf Social-Media-Plattformen untersuchen. In einer ersten Phase werden wir einen umfangreichen Übersichtsbericht über die Bereiche erstellen, die derzeit erforscht werden, einschließlich des jeweiligen Stands der Technik, bestehender…
abgeschlossen, 05/2021 - 12/2021
-
DeepText: Intelligente Textanalyse mit Deep Learning
DeepText entwickelt ein Software-Framework, mit dem automatisch Texte analysiert werden können, um wichtige Informationen zu extrahieren. Das Framework basiert auf modernen Algorithmen aus dem Maschinellen Lernen (Deep Learning), die Texte besser analysieren können als traditionelle Methoden. Damit…
abgeschlossen, 09/2016 - 02/2018
-
Digitale Kommunikationsstrategien für den Kultursektor in der Bodenseeregion
In Kooperation mit der FH Vorarlberg und dem ZHAW Institut für Angewandte Informationstechnologie untersucht das Zentrum für Kulturmanagement, wie eine Kommunikationsstrategie zur Vermarktung und Vermittlung der vielfältigen Kulturaktivitäten und -orte im Bodenseeraum zu gestalten wäre.Das Projekt…
abgeschlossen, 07/2018 - 06/2020
-
LIHLITH – Learning to Interact with Humans by Lifelong Interaction with Humans
The LIHLITH project is a fundamental pilot research project which introduces a new lifelong learning framework for the interaction of humans and machines on specific domains. A Lifelong Learning system learns different tasks sequentially, over time, getting better at solving future related tasks…
abgeschlossen, 10/2017 - 12/2020
Publikationen
-
Tuggener, Lukas; Amirian, Mohammadreza; Benites de Azevedo e Souza, Fernando; von Däniken, Pius; Gupta, Prakhar; Schilling, Frank-Peter; Stadelmann, Thilo,
2020.
Design patterns for resource-constrained automated deep-learning methods.
AI.
1(4), S. 510-538.
Verfügbar unter: https://doi.org/10.3390/ai1040031
-
Deriu, Jan Milan; Tuggener, Don; von Däniken, Pius; Campos, Jon Ander; Rodrigo, Alvaro; Belkacem, Thiziri; Soroa, Aitor; Agirre, Eneko; Cieliebak, Mark,
2020.
In:
Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP).
Conference on Empirical Methods in Natural Language Processing (EMNLP), Online, 16-20 November 2020.
Association for Computational Linguistics.
S. 3971-3984.
Verfügbar unter: https://doi.org/10.18653/v1/2020.emnlp-main.326
-
Deriu, Jan Milan; Mlynchyk, Katsiaryna; Schläpfer, Philippe; Rodrigo, Alvaro; von Grünigen, Dirk; Kaiser, Nicolas; Stockinger, Kurt; Agirre, Eneko; Cieliebak, Mark,
2020.
A methodology for creating question answering corpora using inverse data annotation[Paper].
In:
Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics.
58th Annual Meeting of the Association for Computational Linguistics (ACL 2020), online, 5-10 July 2020.
Association for Computational Linguistics.
S. 897-911.
Verfügbar unter: https://doi.org/10.18653/v1/2020.acl-main.84
-
Ebling, Sarah; Tuggener, Don; Hürlimann, Manuela; Cieliebak, Mark; Volk, Martin, Hrsg.,
2020.
5th SwissText & 16th KONVENS Joint Conference, Zurich (online), 24-25 June 2020.
.
Verfügbar unter: http://ceur-ws.org/Vol-2624/
-
von Däniken, Pius; Hürlimann, Manuela; Cieliebak, Mark,
2020.
Overview of the GermEval 2020 shared task on Swiss German language identification[Paper].
In:
Ebling, Sarah; Tuggener, Don; Hürlimann, Manuela; Cieliebak, Mark; Volk, Martin, Hrsg.,
Proceedings of the 5th Swiss Text Analytics Conference (SwissText) & 16th Conference on Natural Language Processing (KONVENS).
5th SwissText & 16th KONVENS Joint Conference, Zurich (online), 24-25 June 2020.
CEUR Workshop Proceedings.
Verfügbar unter: https://doi.org/10.21256/zhaw-21549