Machine Perception and Cognition Group

«KI ist DIE Schlüsseltechnologie des digitalen Wandels in allen Branchen und Sektoren und sie hat starke Auswirkungen auf unsere Gesellschaften. Darum leistet unsere Forschung wichtige Beiträge zu robusten und vertrauenswürdigen KI-Methoden, und wir vermitteln mit Begeisterung deren sichere Umsetzung und Anwendung.»
Expertise

- Mustererkennung mit Deep Learning
- Maschinelle Wahrnehmung, Computer Vision und Sprechererkennung
- Entwicklung neuronaler Systeme
Die Machine Perception and Cognition-Gruppe forscht über Mustererkennung und arbeitet an einer Vielzahl von Aufgaben mit Bild-, Ton- oder allgemein Signaldaten. Wir befassen uns mit der Methodik der tiefen neuronalen Netze (Deep Neural Networks) und des Reinforcement Learning, inspiriert durch biologisches Lernen. Jede unserer Aufgaben hat ihr eigenes Lernziel (z. B. Erkennung, Klassifizierung, Clustering, Segmentierung, Novelty Detection, Steuerung) und ihren eigenen Anwendungsfall (z. B. vorausschauende Instandhaltung (Predictive Maintenance), Sprechererkennung für Multimedia-Indizierung, Dokumentanalyse, optische Notenerkennung, Computer Vision für industrielle Qualitätskontrolle, automatisiertes maschinelles Lernen, Deep Reinforcement Learning für automatisierte Spiele oder Gebäudeleittechnik). Diese werfen ihrerseits ein Licht auf verschiedene Aspekte des Lernprozesses. Wir nutzen diese Erfahrungen, um allgemeinere KI-Systeme zu kreieren, die auf neuronalen Architekturen basieren.
Angebote
- Einblick: Keynotes, Trainings
- KI-Beratung: Workshops, Expertenunterstützung, Beratung, Technikfolgenabschätzung
- Forschung und Entwicklung: kleine bis grosse Gemeinschaftsprojekte, Drittmittelforschung, studentische Projekte, praxiserprobte Prototypen
Team
Projekte
-
dAIrector – Automatisierte Mehrkamera-Liveproduktion für Veranstaltungen (dAIrector)
Der dAIrector automatisiert Multicam-Liveproduktionen von Konzerten, Theater, Comedy und Musicals durch kreative KI-Regie, die der Dramaturgie auf der Bühne folgt. Er wird via YourStage.live kleinen Bühnen, Events, Festivals und Künstler einen Zugang zu einem weltweiten Publikum bieten.
laufend, 01/2025 - 12/2027
-
Studie zur semiautomatischen Plakaterschliessung an der Schweizerischen Nationalbibliothek (SemPla)
Täglich bekommt die Schweizerische Nationalbibliothek neue physische Plakate und Poster zur Aufnahme in ihren Katalog. Wie kann der Prozess zur Plakaterschliessung durch aktuelle KI Systeme verbessert werden?
abgeschlossen, 05/2024 - 11/2024
-
Deep Dive ML on Simulated Enzyme-Electrolysis Performance
Deep Dive ML on Simulated Enzyme-Electrolysis Performance | ZHAW Zürcher Hochschule für Angewandte Wissenschaften Hochschule Forschung Deep Dive ML on Simulated Enzyme-Electrolysis Performance Eckdaten Kontakt Beschreibung The goal of this pilot study is to research requirements needed to develop a…
abgeschlossen, 11/2023 - 03/2024
-
AI for REAL-world NETwork operation (AI4REALNET)
AI for REAL-world NETwork operation (AI4REALNET) | ZHAW Zürcher Hochschule für Angewandte Wissenschaften Hochschule Forschung AI for REAL-world NETwork operation (AI4REALNET) Eckdaten Kontakt Beschreibung The scope of AI4REALNET covers the perspective of AI-based solutions addressing critical…
laufend, 10/2023 - 03/2027
-
Stability of self-organizing net fragments as inductive bias for next-generation deep learning
Stability of self-organizing net fragments as inductive bias for next-generation deep learning | ZHAW Zürcher Hochschule für Angewandte Wissenschaften Hochschule Forschung Stability of self-organizing net fragments as inductive bias for next-generation deep learning Eckdaten Kontakt Beschreibung We…
laufend, 09/2023 - 08/2025
-
Machine Learning für Body Composition Analysis (ML-BCA)
Machine Learning für Body Composition Analysis (ML-BCA) | ZHAW Zürcher Hochschule für Angewandte Wissenschaften Hochschule Forschung Machine Learning für Body Composition Analysis (ML-BCA) Eckdaten Kontakt Beschreibung Das Centre for Artificial Intelligence (CAI) der ZHAW hat gemeinsam mit dem…
laufend, 04/2023 - 03/2025
-
3D-Master for a Digitized Manufacturing Platform
3D-Master for a Digitized Manufacturing Platform | ZHAW Zürcher Hochschule für Angewandte Wissenschaften Hochschule Forschung 3D-Master for a Digitized Manufacturing Platform Eckdaten Kontakt Beschreibung Wir erweitern die Real Time Manufacturing Services von Bossard durch die automatische…
laufend, 12/2022 - 05/2025
-
certAInty – A Certification Scheme for AI systems (certAInty)
certAInty – A Certification Scheme for AI systems (certAInty) | ZHAW Zürcher Hochschule für Angewandte Wissenschaften Hochschule Forschung certAInty – A Certification Scheme for AI systems (certAInty) Eckdaten Kontakt Beschreibung Certification of AI Systems by an accredited body increases trust,…
abgeschlossen, 11/2022 - 12/2024
-
DISTRAL: Industrial Process Monitoring for Injection Molding with Distributed Transfer Learning
DISTRAL: Industrial Process Monitoring for Injection Molding with Distributed Transfer Learning | ZHAW Zürcher Hochschule für Angewandte Wissenschaften Hochschule Forschung DISTRAL: Industrial Process Monitoring for Injection Molding with Distributed Transfer…
laufend, 10/2022 - 03/2025
-
AI powered CBCT for improved Combination Cancer Therapy (AC3T)
AI powered CBCT for improved Combination Cancer Therapy (AC3T) | ZHAW Zürcher Hochschule für Angewandte Wissenschaften Hochschule Forschung AI powered CBCT for improved Combination Cancer Therapy (AC3T) Eckdaten Kontakt Beschreibung The project enables a novel, combined, adaptive cancer therapy…
laufend, 05/2022 - 02/2025
-
AUTODIDACT – Automated Video Data Annotation to Empower the ICU Cockpit Platform for Clinical Decision Support
AUTODIDACT – Automated Video Data Annotation to Empower the ICU Cockpit Platform for Clinical Decision Support | ZHAW Zürcher Hochschule für Angewandte Wissenschaften Hochschule Forschung AUTODIDACT – Automated Video Data Annotation to Empower the ICU Cockpit Platform for Clinical Decision…
abgeschlossen, 02/2022 - 12/2022
-
Pilot study machine learning for injection molding processes
Pilot study machine learning for injection molding processes | ZHAW Zürcher Hochschule für Angewandte Wissenschaften Hochschule Forschung Pilot study machine learning for injection molding processes Eckdaten Kontakt Beschreibung Forschende des CAI und InES untersuchen im Rahmen eines technischen…
abgeschlossen, 09/2021 - 03/2022
-
Good practices for responsible development of AI-based applications in healthcare
Good practices for responsible development of AI-based applications in healthcare | ZHAW Zürcher Hochschule für Angewandte Wissenschaften Hochschule Forschung Good practices for responsible development of AI-based applications in healthcare Eckdaten Kontakt Beschreibung This project will identify…
abgeschlossen, 09/2021 - 08/2023
-
Accessible Scientific PDFs for All
Accessible Scientific PDFs for All | ZHAW Zürcher Hochschule für Angewandte Wissenschaften Hochschule Forschung Accessible Scientific PDFs for All Eckdaten Kontakt Beschreibung PDF is the most popular document format to provide and distribute information on the internet. It was developed by Adobe…
laufend, 04/2021 - 05/2025
-
Synthetic data generation of CoVID-19 CT/X-rays images for enabling fast triage of healthy vs. unhealthy patients
Synthetic data generation of CoVID-19 CT/X-rays images for enabling fast triage of healthy vs. unhealthy patients | ZHAW Zürcher Hochschule für Angewandte Wissenschaften Hochschule Forschung Synthetic data generation of CoVID-19 CT/X-rays images for enabling fast triage of healthy vs. unhealthy…
abgeschlossen, 05/2020 - 07/2020
-
Standardized Data and Modeling for AI-based CoVID-19 Diagnosis Support on CT Scans (SDMCT) (SDMCT)
Standardized Data and Modeling for AI-based CoVID-19 Diagnosis Support on CT Scans (SDMCT) (SDMCT) | ZHAW Zürcher Hochschule für Angewandte Wissenschaften Hochschule Forschung Standardized Data and Modeling for AI-based CoVID-19 Diagnosis Support on CT Scans (SDMCT)…
abgeschlossen, 05/2020 - 10/2020
-
DIR3CT: Deep Image Reconstruction through X-Ray Projection-based 3D Learning of Computed Tomography Volumes
DIR3CT: Deep Image Reconstruction through X-Ray Projection-based 3D Learning of Computed Tomography Volumes | ZHAW Zürcher Hochschule für Angewandte Wissenschaften Hochschule Forschung DIR3CT: Deep Image Reconstruction through X-Ray Projection-based 3D Learning of Computed Tomography…
abgeschlossen, 02/2020 - 05/2022
-
TAILOR – Foundations of Trustworthy AI - Integrating Reasoning, Learning and Optimization
TAILOR – Foundations of Trustworthy AI - Integrating Reasoning, Learning and Optimization | ZHAW Zürcher Hochschule für Angewandte Wissenschaften Hochschule Forschung TAILOR – Foundations of Trustworthy AI - Integrating Reasoning, Learning and Optimization Eckdaten Kontakt Beschreibung The main…
abgeschlossen, 01/2020 - 12/2021
-
RealScore – Scanning of Real-World Sheet Music for a Digital Music Stand
RealScore – Scanning of Real-World Sheet Music for a Digital Music Stand | ZHAW Zürcher Hochschule für Angewandte Wissenschaften Hochschule Forschung RealScore – Scanning of Real-World Sheet Music for a Digital Music Stand Eckdaten Kontakt Beschreibung ScorePad’s sheet music scanning service works…
abgeschlossen, 09/2019 - 05/2022
-
Visual Food Waste Analysis for Sustainable Kitchens (FWA)
Visual Food Waste Analysis for Sustainable Kitchens (FWA) | ZHAW Zürcher Hochschule für Angewandte Wissenschaften Hochschule Forschung Visual Food Waste Analysis for Sustainable Kitchens (FWA) Eckdaten Kontakt Beschreibung Ein neuartiger Ansatz für die vollautomatische Analyse von…
abgeschlossen, 07/2019 - 09/2021
Publikationen
-
Emberger, Raphael; Boss, Jens Michael; Baumann, Daniel; Seric, Marko; Huo, Shufan; Tuggener, Lukas; Keller, Emanuela; Stadelmann, Thilo,
2023.
Video object detection for privacy-preserving patient monitoring in intensive care [Paper].
In:
2023 10th IEEE Swiss Conference on Data Science (SDS).
10th IEEE Swiss Conference on Data Science (SDS), Zurich, Switzerland, 22-23 June 2023.
IEEE.
S. 85-88.
Verfügbar unter: https://doi.org/10.1109/SDS57534.2023.00019
-
Amirian, Mohammadreza; Montoya-Zegarra, Javier A.; Herzig, Ivo; Eggenberger Hotz, Peter; Lichtensteiger, Lukas; Morf, Marco; Züst, Alexander; Paysan, Pascal; Peterlik, Igor; Scheib, Stefan; Füchslin, Rudolf Marcel; Stadelmann, Thilo; Schilling, Frank-Peter,
2023.
Medical Physics.
50(10), S. 6228-6242.
Verfügbar unter: https://doi.org/10.1002/mp.16405
-
2023.
KI als Chance für die angewandten Wissenschaften im Wettbewerb der Hochschulen.
In:
Bürgenstock-Konferenz der Schweizer Fachhochschulen und Pädagogischen Hochschulen, Luzern, Schweiz, 20.-21. Januar 2023.
Verfügbar unter: https://www.buergenstock-konferenz.ch/images/2023/19_Website_Eingabe_Stadelmann.pdf
-
Weng, Joanna; Reif, Monika; Chavarriaga, Ricardo; Schilling, Frank-Peter,
2023.
certAInty : a certification scheme for AI systems (Innosuisse project) [Poster].
In:
Datalab Symposium, Winterthur, Schweiz, 11. Januar 2023.
ZHAW Zürcher Hochschule für Angewandte Wissenschaften.
Verfügbar unter: https://doi.org/10.21256/zhaw-27261
-
Battaglia, Mattia; Comi, Ennio; Stadelmann, Thilo; Hiestand, Roman; Ruhstaller, Beat; Knapp, Evelyne,
2023.
Deep ensemble inverse model for image-based estimation of solar cell parameters.
APL Machine Learning.
1(3), S. 036108.
Verfügbar unter: https://doi.org/10.1063/5.0139707
Sonstige Veröffentlichungen
Wann | Art | Titel |
---|---|---|
2023 | Extended Abstract | Thilo Stadelmann. KI als Chance für die angewandten Wissenschaften im Wettbewerb der Hochschulen. Workshop (“Atelier”) at the Bürgenstock-Konferenz der Schweizer Fachhochschulen und Pädagogischen Hochschulen 2023, Luzern, Schweiz, 20. Januar 2023 |
2022 | Extended Abstract | Christoph von der Malsburg, Benjamin F. Grewe, and Thilo Stadelmann. Making Sense of the Natural Environment. Proceedings of the KogWis 2022 - Understanding Minds Biannual Conference of the German Cognitive Science Society, Freiburg, Germany, September 5-7, 2022. |
2022 | Open Research Data | Felix M. Schmitt-Koopmann, Elaine M. Huang, Hans-Peter Hutter, Thilo Stadelmann, und Alireza Darvishy. FormulaNet: Ein Benchmark-Datensatz für die Erkennung mathematischer Formeln. Eine ungelöste Teilaufgabe der Dokumentenanalyse ist die Erkennung mathematischer Formeln (MFD). Forschungen von uns und anderen haben gezeigt, dass bestehende MFD-Datensätze mit Inline- und Display-Formel-Etiketten klein sind und eine unzureichende Etikettierungsqualität aufweisen. Es besteht daher ein dringender Bedarf an Datensätzen mit besserer Beschriftungsqualität für die zukünftige Forschung im Bereich MFD, da diese einen großen Einfluss auf die Leistung der darauf trainierten Modelle haben. Wir stellen eine fortschrittliche Etikettierungspipeline und einen neuen Datensatz namens FormulaNet vor. Mit über 45.000 Seiten ist FormulaNet unserer Meinung nach der größte MFD-Datensatz mit Inline-Formelbeschriftungen. Unser Datensatz soll bei der Bewältigung der MFD-Aufgabe helfen und kann die Entwicklung neuer Anwendungen ermöglichen, wie z. B. die Zugänglichkeit mathematischer Formeln in PDFs für sehbehinderte Benutzer von Bildschirmlesegeräten. |
2020 | Open Research Data | Lukas Tuggener, Yvan Putra Satyawan, Alexander Pacha, Jürgen Schmidhuber, and Thilo Stadelmann, DeepScoresV2. The DeepScoresV2 Dataset for Music Object Detection contains digitally rendered images of written sheet music, together with the corresponding ground truth to fit various types of machine learning models. A total of 151 Million different instances of music symbols, belonging to 135 different classes are annotated. The total Dataset contains 255,385 Images. For most researches, the dense version, containing 1714 of the most diverse and interesting images, is a good starting point. |