Machine Perception and Cognition Group

«KI ist DIE Schlüsseltechnologie des digitalen Wandels in allen Branchen und Sektoren und sie hat starke Auswirkungen auf unsere Gesellschaften. Darum leistet unsere Forschung wichtige Beiträge zu robusten und vertrauenswürdigen KI-Methoden, und wir vermitteln mit Begeisterung deren sichere Umsetzung und Anwendung.»
Expertise

- Mustererkennung mit Deep Learning
- Maschinelle Wahrnehmung, Computer Vision und Sprechererkennung
- Entwicklung neuronaler Systeme
Die Machine Perception and Cognition-Gruppe forscht über Mustererkennung und arbeitet an einer Vielzahl von Aufgaben mit Bild-, Ton- oder allgemein Signaldaten. Wir befassen uns mit der Methodik der tiefen neuronalen Netze (Deep Neural Networks) und des Reinforcement Learning, inspiriert durch biologisches Lernen. Jede unserer Aufgaben hat ihr eigenes Lernziel (z. B. Erkennung, Klassifizierung, Clustering, Segmentierung, Novelty Detection, Steuerung) und ihren eigenen Anwendungsfall (z. B. vorausschauende Instandhaltung (Predictive Maintenance), Sprechererkennung für Multimedia-Indizierung, Dokumentanalyse, optische Notenerkennung, Computer Vision für industrielle Qualitätskontrolle, automatisiertes maschinelles Lernen, Deep Reinforcement Learning für automatisierte Spiele oder Gebäudeleittechnik). Diese werfen ihrerseits ein Licht auf verschiedene Aspekte des Lernprozesses. Wir nutzen diese Erfahrungen, um allgemeinere KI-Systeme zu kreieren, die auf neuronalen Architekturen basieren.
Angebote
- Einblick: Keynotes, Trainings
- KI-Beratung: Workshops, Expertenunterstützung, Beratung, Technikfolgenabschätzung
- Forschung und Entwicklung: kleine bis grosse Gemeinschaftsprojekte, Drittmittelforschung, studentische Projekte, praxiserprobte Prototypen
Team
Projekte
-
Machine Learning für Body Composition Analysis (ML-BCA)
Das Centre for Artificial Intelligence (CAI) der ZHAW hat gemeinsam mit dem Kantonsspital Aarau im Rahmen von Vorstudien die Grundlage für Machine Learning-unterstützte Body Composition Analysis auf Bildbeständen des KSA gelegt und hierbei vielversprechende Ergebnisse erzielt. Ziel dieses Projekts…
abgeschlossen, 04/2023 - 03/2025
-
AI for REAL-world NETwork operation (AI4REALNET)
The scope of AI4REALNET covers the perspective of AI-based solutions addressing critical systems (electricity, railway, and air traffic management) modelled by networks that can be simulated, and are traditionally operated by humans, and where AI systems complement and augment human abilities. It…
laufend, 10/2023 - 03/2027
-
SODES – Swiss Open Data Exploration System
In den letzten Jahren haben nationale und internationale Institutionen, Regierungen und NGOs große Datenmengen öffentlich zugänglich gemacht: Es gibt buchstäblich Tausende von offenen Datenquellen, mit Temperaturmessungen, Börsenkursen, Bevölkerungs- und Einkommensstatistiken etc. Die meisten…
abgeschlossen, 12/2013 - 07/2014
-
Complexity 4.0
Management der Komplexität globaler Wertschöpfungssysteme
abgeschlossen, 06/2016 - 08/2017
-
Studie zur semiautomatischen Plakaterschliessung an der Schweizerischen Nationalbibliothek (SemPla)
Täglich bekommt die Schweizerische Nationalbibliothek neue physische Plakate und Poster zur Aufnahme in ihren Katalog. Wie kann der Prozess zur Plakaterschliessung durch aktuelle KI Systeme verbessert werden?
abgeschlossen, 05/2024 - 11/2024
-
Machbarkeitsstudie Reinforcement Learning Control für Heizsysteme
Wir schaffen die wissenschaftlichen Grundlagen für den Einsatz selbstlernender Energiemanagementsysteme für Gebäude mit heterogenen Energiesystemen und zeitlich variablem Nutzerverhalten. Eine solche Steuerung ermöglicht es, dauerhaft optimal arbeitende Energiesysteme auch für ältere Gebäude mit nur…
abgeschlossen, 10/2018 - 10/2020
-
AI-BRIDGE - A Think-and-Do-Tank for Responsible Development and Societal Alignment of Artificial Intelligence Systems (AI-BRIDGE)
AI-BRIDGE bringt verantwortungsvolle KI in die Praxis, indem es die Kluft zwischen gesellschaftlichen Werten und der Entwicklung von KI-Technologie und -Lösungen überbrückt. Der AI-BRIDGE Think-and-Do Tank wird Organisationen dabei helfen, das Potenzial der KI zu nutzen und gleichzeitig die…
laufend, 04/2025 - 12/2029
-
3D-Master for a Digitized Manufacturing Platform
Wir erweitern die Real Time Manufacturing Services von Bossard durch die automatische Erstellung von Angeboten für Spezialteile. Das Herzstück ist ein von KI erstellter 3D-Master, der alle verfügbaren Teilinformationen vereint und die Preisfindung und Machbarkeitsbewertung für viele…
abgeschlossen, 12/2022 - 05/2025
-
DISTRAL: Industrial Process Monitoring for Injection Molding with Distributed Transfer Learning
We develop a distributed machine learning system to sort out defect plastic parts during production. Main challenge is the transferability of learnt process know-how from case to case; the solution builds on domain adaptation, continual data-centric deep learning and federated edge computing.
abgeschlossen, 10/2022 - 03/2025
-
Radiosands
Radiosands ist eine begehbare Installation, in der mehrere gleichzeitig stattfindende Radiosendungen analysiert und neu zusammengesetzt werden. Die Installation nutzt die Geschwindigkeit und algorithmische Potenz digitaler Technik, um eine neue Erfahrung zu schaffen: Eine Echtzeit-Collage von…
abgeschlossen, 05/2018 - 02/2020
-
RealScore – Scanning of Real-World Sheet Music for a Digital Music Stand
ScorePad’s sheet music scanning service works for high quality input; to scale up business, it should work as well for smartphone pictures, used sheets etc. Project RealScore enhances the successful predecessor project by making deep learning adapt to unseen data through unsupervised learning.
abgeschlossen, 09/2019 - 05/2022
-
Visual Food Waste Analysis for Sustainable Kitchens (FWA)
Ein neuartiger Ansatz für die vollautomatische Analyse von Lebensmittelabfällen für Großküchen wird untersucht. Lebensmittelabfälle werden mit einer neuen Kameraeinrichtung automatisch erkannt, in Echtzeit analysiert und mit Hilfe von maschinellen Lernalgorithmen klassifiziert.
abgeschlossen, 07/2019 - 09/2021
-
Stability of self-organizing net fragments as inductive bias for next-generation deep learning
We recently released "A Theory of Natural Intelligence", proposing a possible key to the emergence of intelligence in biological learners. Goal of this fellowship is to develop a technical implementation of the concept of self-organizing netfragments within contemporary deep artificial…
laufend, 09/2023 - 08/2025
-
certAInty – A Certification Scheme for AI systems (certAInty)
Certification of AI Systems by an accredited body increases trust, accelerates adoption and enables their use for safety-critical applications. We develop a Certification Scheme comprising specific requirements, criteria, measures, and technical methods for assessing Machine Learning enabled…
abgeschlossen, 11/2022 - 12/2024
-
FarmAI – Künstliche Intelligenz für den Farming Simulator
Für die weltweit erfolgreiche Videospiel-Serie “Farming Simulator” von GIANTS Software GmbH wird mittels künstlicher Intelligenz (KI) ein neuer, langfristig unterhaltender, einfach erweiterbarer Spielmodus ermöglicht. In diesem Projekt werden Reinforcement Learning Algorithmen eingesetzt, um…
abgeschlossen, 12/2016 - 05/2018
-
QualitAI - Quality control of industrial products via deep learning on images
Mit dem Projekt QualitAI wird eine vollautomatische Qualitätskontrollanlage realisiert. Die Anlage wird in der medizinaltechnischen Nische der Ballonkatheter auf den Markt gebracht. Die Anlage kann die heutigen Prozesse stark vereinfachen und beschleunigen. Durch eine Vollautomatisierung und das…
abgeschlossen, 08/2017 - 01/2020
-
Good practices for responsible development of AI-based applications in healthcare
This project will identify proven methods, practices and standards that support responsible research and development of AI systems for health. They will be tested in use cases from medical imaging and neurotechnology, publicly released and published as a guideline of recommended best practices.
abgeschlossen, 09/2021 - 08/2023
-
MobileMall
Entwicklung intelligenter Angebots- und Nachfrageverteilung in einem mobilen virtuellen Einkaufszentrum für den lokalen Detailhandel
abgeschlossen, 12/2013 - 02/2015
-
DeepText: Intelligente Textanalyse mit Deep Learning
DeepText entwickelt ein Software-Framework, mit dem automatisch Texte analysiert werden können, um wichtige Informationen zu extrahieren. Das Framework basiert auf modernen Algorithmen aus dem Maschinellen Lernen (Deep Learning), die Texte besser analysieren können als traditionelle Methoden. Damit…
abgeschlossen, 09/2016 - 02/2018
-
Automatische Artikelsegmentierung von Zeitungsseiten für "Real Time Print Media Monitoring" (PANOPTES)
Das neue Produkt "Real Time Print Media Monitoring" von ARGUS DATA INSIGHTS Schweiz AG ist eine automatisierte Pipeline, die relevante Artikel in Printmedien identifiziert, extrahiert, und den Kunden in Echtzeit zustellt. Grundlage für das Produkt ist eine automatische Segmentierung von…
abgeschlossen, 07/2015 - 09/2017
Publikationen
-
Meyer, Benjamin; Sager, Pascal; Abdulkadir, Ahmed; Grewe, Benjamin F.; Schuetz, Philipp; Stadelmann, Thilo; Burn, Felice,
2025.
In:
2025 12th IEEE Swiss Conference on Data Science (SDS).
12th IEEE Swiss Conference on Data Science (SDS), Zurich, Switzerland, 26-27 June 2025.
IEEE.
Verfügbar unter: https://doi.org/10.21256/zhaw-33457
-
Yan, Peng; Abdulkadir, Ahmed; Schatte, Gerrit A.; Aguzzi, Giulia; Gha, Joonsu; Pascher, Nikola; Rosenthal, Matthias; Gao, Yunlong; Grewe, Benjamin F.; Stadelmann, Thilo,
2025.
Learning actionable world models for industrial process control[Paper].
In:
2025 12th IEEE Swiss Conference on Data Science (SDS).
12th IEEE Swiss Conference on Data Science (SDS), Zurich, Switzerland, 26-27 June 2025.
IEEE.
Verfügbar unter: https://doi.org/10.21256/zhaw-33031
-
Prabhu Siddhartha, Guptara, Hrsg.,
2025.
Global Resilience White Paper
; 2.
Global Resilience Publishing.
Verfügbar unter: https://doi.org/10.21256/zhaw-32180
-
Ali, Waqar; Vascon, Sebastiano; Stadelmann, Thilo; Pelillo, Marcello,
2024.
Hierarchical glocal attention pooling for graph classification.
Pattern Recognition Letters.
186, S. 71-77.
Verfügbar unter: https://doi.org/10.1016/j.patrec.2024.09.009
-
Bolt, Peter; Ziebart, Volker; Jaeger, Christian; Schmid, Nicolas; Stadelmann, Thilo; Füchslin, Rudolf Marcel,
2024.
A simulation study on energy optimization in building control with reinforcement learning[Paper].
In:
Suen, Ching Yee; Krzyzak, Adam; Ravanelli, Mirco; Trentin, Edmondo; Subakan, Cem; Nobile, Nicola, Hrsg.,
Artificial Neural Networks in Pattern Recognition.
11th IAPR TC3 Workshop on Artificial Neural Networks for Pattern Recognition (ANNPR), Montreal, Canada, 10-12 October 2024.
Cham:
Springer.
Verfügbar unter: https://doi.org/10.1007/978-3-031-71602-7_27
Sonstige Veröffentlichungen
Wann | Art | Titel |
---|---|---|
2023 | Extended Abstract | Thilo Stadelmann. KI als Chance für die angewandten Wissenschaften im Wettbewerb der Hochschulen. Workshop (“Atelier”) at the Bürgenstock-Konferenz der Schweizer Fachhochschulen und Pädagogischen Hochschulen 2023, Luzern, Schweiz, 20. Januar 2023 |
2022 | Extended Abstract | Christoph von der Malsburg, Benjamin F. Grewe, and Thilo Stadelmann. Making Sense of the Natural Environment. Proceedings of the KogWis 2022 - Understanding Minds Biannual Conference of the German Cognitive Science Society, Freiburg, Germany, September 5-7, 2022. |
2022 | Open Research Data | Felix M. Schmitt-Koopmann, Elaine M. Huang, Hans-Peter Hutter, Thilo Stadelmann, und Alireza Darvishy. FormulaNet: Ein Benchmark-Datensatz für die Erkennung mathematischer Formeln. Eine ungelöste Teilaufgabe der Dokumentenanalyse ist die Erkennung mathematischer Formeln (MFD). Forschungen von uns und anderen haben gezeigt, dass bestehende MFD-Datensätze mit Inline- und Display-Formel-Etiketten klein sind und eine unzureichende Etikettierungsqualität aufweisen. Es besteht daher ein dringender Bedarf an Datensätzen mit besserer Beschriftungsqualität für die zukünftige Forschung im Bereich MFD, da diese einen großen Einfluss auf die Leistung der darauf trainierten Modelle haben. Wir stellen eine fortschrittliche Etikettierungspipeline und einen neuen Datensatz namens FormulaNet vor. Mit über 45.000 Seiten ist FormulaNet unserer Meinung nach der größte MFD-Datensatz mit Inline-Formelbeschriftungen. Unser Datensatz soll bei der Bewältigung der MFD-Aufgabe helfen und kann die Entwicklung neuer Anwendungen ermöglichen, wie z. B. die Zugänglichkeit mathematischer Formeln in PDFs für sehbehinderte Benutzer von Bildschirmlesegeräten. |
2020 | Open Research Data | Lukas Tuggener, Yvan Putra Satyawan, Alexander Pacha, Jürgen Schmidhuber, and Thilo Stadelmann, DeepScoresV2. The DeepScoresV2 Dataset for Music Object Detection contains digitally rendered images of written sheet music, together with the corresponding ground truth to fit various types of machine learning models. A total of 151 Million different instances of music symbols, belonging to 135 different classes are annotated. The total Dataset contains 255,385 Images. For most researches, the dense version, containing 1714 of the most diverse and interesting images, is a good starting point. |