Machine Perception and Cognition Group

«KI ist DIE Schlüsseltechnologie des digitalen Wandels in allen Branchen und Sektoren und sie hat starke Auswirkungen auf unsere Gesellschaften. Darum leistet unsere Forschung wichtige Beiträge zu robusten und vertrauenswürdigen KI-Methoden, und wir vermitteln mit Begeisterung deren sichere Umsetzung und Anwendung.»
Expertise

- Mustererkennung mit Deep Learning
- Maschinelle Wahrnehmung, Computer Vision und Sprechererkennung
- Entwicklung neuronaler Systeme
Die Machine Perception and Cognition-Gruppe forscht über Mustererkennung und arbeitet an einer Vielzahl von Aufgaben mit Bild-, Ton- oder allgemein Signaldaten. Wir befassen uns mit der Methodik der tiefen neuronalen Netze (Deep Neural Networks) und des Reinforcement Learning, inspiriert durch biologisches Lernen. Jede unserer Aufgaben hat ihr eigenes Lernziel (z. B. Erkennung, Klassifizierung, Clustering, Segmentierung, Novelty Detection, Steuerung) und ihren eigenen Anwendungsfall (z. B. vorausschauende Instandhaltung (Predictive Maintenance), Sprechererkennung für Multimedia-Indizierung, Dokumentanalyse, optische Notenerkennung, Computer Vision für industrielle Qualitätskontrolle, automatisiertes maschinelles Lernen, Deep Reinforcement Learning für automatisierte Spiele oder Gebäudeleittechnik). Diese werfen ihrerseits ein Licht auf verschiedene Aspekte des Lernprozesses. Wir nutzen diese Erfahrungen, um allgemeinere KI-Systeme zu kreieren, die auf neuronalen Architekturen basieren.
Angebote
- Einblick: Keynotes, Trainings
- KI-Beratung: Workshops, Expertenunterstützung, Beratung, Technikfolgenabschätzung
- Forschung und Entwicklung: kleine bis grosse Gemeinschaftsprojekte, Drittmittelforschung, studentische Projekte, praxiserprobte Prototypen
Team
Projekte
-
AI-BRIDGE - A Think-and-Do-Tank for Responsible Development and Societal Alignment of Artificial Intelligence Systems (AI-BRIDGE)
AI-BRIDGE bringt verantwortungsvolle KI in die Praxis, indem es die Kluft zwischen gesellschaftlichen Werten und der Entwicklung von KI-Technologie und -Lösungen überbrückt. Der AI-BRIDGE Think-and-Do Tank wird Organisationen dabei helfen, das Potenzial der KI zu nutzen und gleichzeitig die…
laufend, 04/2025 - 12/2029
-
dAIrector – Automatisierte Mehrkamera-Liveproduktion für Veranstaltungen
Der dAIrector automatisiert Multicam-Liveproduktionen von Konzerten, Theater, Comedy und Musicals durch kreative KI-Regie, die der Dramaturgie auf der Bühne folgt. Er wird via YourStage.live kleinen Bühnen, Events, Festivals und Künstler einen Zugang zu einem weltweiten Publikum bieten.
laufend, 01/2025 - 12/2027
-
Studie zur semiautomatischen Plakaterschliessung an der Schweizerischen Nationalbibliothek (SemPla)
Täglich bekommt die Schweizerische Nationalbibliothek neue physische Plakate und Poster zur Aufnahme in ihren Katalog. Wie kann der Prozess zur Plakaterschliessung durch aktuelle KI Systeme verbessert werden?
abgeschlossen, 05/2024 - 11/2024
-
Deep Dive ML on Simulated Enzyme-Electrolysis Performance
The goal of this pilot study is to research requirements needed to develop a computational model that simulates the fluidic and electro-biochemical dynamics in the power-to-liquid process in order to optimise the performance, efficiency and longevity of enzymes.
abgeschlossen, 11/2023 - 03/2024
-
AI for REAL-world NETwork operation (AI4REALNET)
The scope of AI4REALNET covers the perspective of AI-based solutions addressing critical systems (electricity, railway, and air traffic management) modelled by networks that can be simulated, and are traditionally operated by humans, and where AI systems complement and augment human abilities. It…
laufend, 10/2023 - 03/2027
Publikationen
-
Meyer, Benjamin; Stadelmann, Thilo; Lüthi, Marcel,
2024.
ScalaGrad : a statically typed automatic differentiation library for safer data science[Paper].
In:
2024 11th IEEE Swiss Conference on Data Science (SDS).
11th IEEE Swiss Conference on Data Science (SDS), Zurich, Switzerland, 30-31 May 2024.
IEEE.
S. 229-232.
Verfügbar unter: https://doi.org/10.1109/SDS60720.2024.00040
-
Tuggener, Lukas; Sager, Pascal; Taoudi-Benchekroun, Yassine; Grewe, Benjamin F.; Stadelmann, Thilo,
2024.
So you want your private LLM at home? : a survey and benchmark of methods for efficient GPTs[Paper].
In:
2024 11th IEEE Swiss Conference on Data Science (SDS).
11th IEEE Swiss Conference on Data Science (SDS), Zurich, Switzerland, 30-31 May 2024.
IEEE.
Verfügbar unter: https://doi.org/10.1109/SDS60720.2024.00036
-
Jermain, Peter R; Oswald, Martin; Langdun, Tenzin; Wright, Santana; Khan, Ashraf; Stadelmann, Thilo; Abdulkadir, Ahmed; Yaroslavsky, Anna N.,
2024.
Deep learning-based cell segmentation for rapid optical cytopathology of thyroid cancer.
Scientific Reports.
14(1), S. 16389.
Verfügbar unter: https://doi.org/10.1038/s41598-024-64855-2
-
Dashti, Ali; Stadelmann, Thilo; Kohl, Thomas,
2024.
Machine learning for robust structural uncertainty quantification in fractured reservoirs.
Geothermics.
120(103012).
Verfügbar unter: https://doi.org/10.1016/j.geothermics.2024.103012
-
Schmitt-Koopmann, Felix; Huang, Elaine M.; Hutter, Hans-Peter; Stadelmann, Thilo; Darvishy, Alireza,
2024.
MathNet : a data-centric approach for printed mathematical expression recognition.
IEEE Access.
12, S. 76963-76974.
Verfügbar unter: https://doi.org/10.1109/ACCESS.2024.3404834
Sonstige Veröffentlichungen
Wann | Art | Titel |
---|---|---|
2023 | Extended Abstract | Thilo Stadelmann. KI als Chance für die angewandten Wissenschaften im Wettbewerb der Hochschulen. Workshop (“Atelier”) at the Bürgenstock-Konferenz der Schweizer Fachhochschulen und Pädagogischen Hochschulen 2023, Luzern, Schweiz, 20. Januar 2023 |
2022 | Extended Abstract | Christoph von der Malsburg, Benjamin F. Grewe, and Thilo Stadelmann. Making Sense of the Natural Environment. Proceedings of the KogWis 2022 - Understanding Minds Biannual Conference of the German Cognitive Science Society, Freiburg, Germany, September 5-7, 2022. |
2022 | Open Research Data | Felix M. Schmitt-Koopmann, Elaine M. Huang, Hans-Peter Hutter, Thilo Stadelmann, und Alireza Darvishy. FormulaNet: Ein Benchmark-Datensatz für die Erkennung mathematischer Formeln. Eine ungelöste Teilaufgabe der Dokumentenanalyse ist die Erkennung mathematischer Formeln (MFD). Forschungen von uns und anderen haben gezeigt, dass bestehende MFD-Datensätze mit Inline- und Display-Formel-Etiketten klein sind und eine unzureichende Etikettierungsqualität aufweisen. Es besteht daher ein dringender Bedarf an Datensätzen mit besserer Beschriftungsqualität für die zukünftige Forschung im Bereich MFD, da diese einen großen Einfluss auf die Leistung der darauf trainierten Modelle haben. Wir stellen eine fortschrittliche Etikettierungspipeline und einen neuen Datensatz namens FormulaNet vor. Mit über 45.000 Seiten ist FormulaNet unserer Meinung nach der größte MFD-Datensatz mit Inline-Formelbeschriftungen. Unser Datensatz soll bei der Bewältigung der MFD-Aufgabe helfen und kann die Entwicklung neuer Anwendungen ermöglichen, wie z. B. die Zugänglichkeit mathematischer Formeln in PDFs für sehbehinderte Benutzer von Bildschirmlesegeräten. |
2020 | Open Research Data | Lukas Tuggener, Yvan Putra Satyawan, Alexander Pacha, Jürgen Schmidhuber, and Thilo Stadelmann, DeepScoresV2. The DeepScoresV2 Dataset for Music Object Detection contains digitally rendered images of written sheet music, together with the corresponding ground truth to fit various types of machine learning models. A total of 151 Million different instances of music symbols, belonging to 135 different classes are annotated. The total Dataset contains 255,385 Images. For most researches, the dense version, containing 1714 of the most diverse and interesting images, is a good starting point. |