Computer Vision, Perception and Cognition Group

«KI ist DIE Schlüsseltechnologie des digitalen Wandels in allen Branchen und Sektoren und sie hat starke Auswirkungen auf unsere Gesellschaften. Darum leistet unsere Forschung wichtige Beiträge zu robusten und vertrauenswürdigen KI-Methoden, und wir vermitteln mit Begeisterung deren sichere Umsetzung und Anwendung.»
Expertise

- Mustererkennung mit Deep Learning
- Maschinelle Wahrnehmung, Computer Vision und Sprechererkennung
- Entwicklung neuronaler Systeme
Die Computer Vision, Perception and Cognition-Gruppe forscht über Mustererkennung und arbeitet an einer Vielzahl von Aufgaben mit Bild-, Ton- oder allgemein Signaldaten. Wir befassen uns mit der Methodik der tiefen neuronalen Netze (Deep Neural Networks) und des Reinforcement Learning, inspiriert durch biologisches Lernen. Jede unserer Aufgaben hat ihr eigenes Lernziel (z. B. Erkennung, Klassifizierung, Clustering, Segmentierung, Novelty Detection, Steuerung) und ihren eigenen Anwendungsfall (z. B. vorausschauende Instandhaltung (Predictive Maintenance), Sprechererkennung für Multimedia-Indizierung, Dokumentanalyse, optische Notenerkennung, Computer Vision für industrielle Qualitätskontrolle, automatisiertes maschinelles Lernen, Deep Reinforcement Learning für automatisierte Spiele oder Gebäudeleittechnik). Diese werfen ihrerseits ein Licht auf verschiedene Aspekte des Lernprozesses. Wir nutzen diese Erfahrungen, um allgemeinere KI-Systeme zu kreieren, die auf neuronalen Architekturen basieren.
Angebote
- Einblick: Keynotes, Trainings
- KI-Beratung: Workshops, Expertenunterstützung, Beratung, Technikfolgenabschätzung
- Forschung und Entwicklung: kleine bis grosse Gemeinschaftsprojekte, Drittmittelforschung, studentische Projekte, praxiserprobte Prototypen
Team
Projekte
- Vorherige Seite
- Seite 01
- Seite 02
- Seite 03
- Seite 04
- Nächste Seite
-
Synthetic data generation of CoVID-19 CT/X-rays images for enabling fast triage of healthy vs. unhealthy patients
The automatic analysis of X-ray/CT images through artificial intelligence models can be useful to automate the clinical scanning procedure. Nonetheless, the limited access to real COVID patient data leads to the need of synthesizing image samples. The goal of this project is to use existing CT/X-ray image datasets ...
-
Standardized Data and Modeling for AI-based CoVID-19 Diagnosis Support on CT Scans (SDMCT)
Hospitals and research institutes are highly investigating applications of AI in medical imaging. However, developed models and datasets are barely mergeable, and the research results are not reproducible on different datasets due to different CT scanners used. Radiologists told us that “unifying data is crucial for ...
-
DIR3CT: Deep Image Reconstruction through X-Ray Projection-based 3D Learning of Computed Tomography Volumes
Project DIR3CT aims at improving the image quality of CBCT images by deep learning (DL) the 3D reconstruction from X-ray images end-to-end. This enables a novel CBCT product to be used during radiation therapy and will allow the use of these images for adaptive treatment.
-
TAILOR – Foundations of Trustworthy AI - Integrating Reasoning, Learning and Optimization
The main ambition of TAILOR is to build the capacity of providing the scientific foundations for Trustworthy AI in Europe by developing a network of research excellence centers with a technical focus on combining research excellence in the areas of learning, optimisation and reasoning . The current scientific ...
-
RealScore – Scanning of Real-World Sheet Music for a Digital Music Stand
ScorePad’s sheet music scanning service works for high quality input; to scale up business, it should work as well for smartphone pictures, used sheets etc. Project RealScore enhances the successful predecessor project by making deep learning adapt to unseen data through unsupervised learning. ...
-
FWA: Visual Food Waste Analysis for Sustainable Kitchens
Ein neuartiger Ansatz für die vollautomatische Analyse von Lebensmittelabfällen für Großküchen wird untersucht. Lebensmittelabfälle werden mit einer neuen Kameraeinrichtung automatisch erkannt, in Echtzeit analysiert und mit Hilfe von maschinellen Lernalgorithmen klassifiziert.
-
Machbarkeitsstudie Reinforcement Learning Control für Heizsysteme
Wir schaffen die wissenschaftlichen Grundlagen für den Einsatz selbstlernender Energiemanagementsysteme für Gebäude mit heterogenen Energiesystemen und zeitlich variablem Nutzerverhalten. Eine solche Steuerung ermöglicht es, dauerhaft optimal arbeitende Energiesysteme auch für ältere Gebäude mit nur teilweise ...
-
Radiosands
Radiosands ist eine begehbare Installation, in der mehrere gleichzeitig stattfindende Radiosendungen analysiert und neu zusammengesetzt werden. Die Installation nutzt die Geschwindigkeit und algorithmische Potenz digitaler Technik, um eine neue Erfahrung zu schaffen: Eine Echtzeit-Collage von klanglichen Fragmenten, ...
-
Ada – Advanced Algorithms for an Artificial Data Analyst
Ada - the Artificial Data Analyst - raises the productivity of data science endeavours by applying data science to itself: we apply empirical optimization also to algorithm and feature selection. Recent developments, e.g. from the MIT, are thus made available as a data product for Swiss industry. ...
-
QualitAI - Quality control of industrial products via deep learning on images
Mit dem Projekt QualitAI wird eine vollautomatische Qualitätskontrollanlage realisiert. Die Anlage wird in der medizinaltechnischen Nische der Ballonkatheter auf den Markt gebracht.Die Anlage kann die heutigen Prozesse stark vereinfachen und beschleunigen. Durch eine Vollautomatisierung und das Ersetzen von heute ...
Publikationen
-
Tuggener, Lukas; Emberger, Raphael; Ghosh, Adhiraj; Sager, Pascal; Satyawan, Yvan Putra; Montoya, Javier; Goldschagg, Simon; Seibold, Florian; Gut, Urs; Ackermann, Philipp; Schmidhuber, Jürgen; Stadelmann, Thilo,
2023.
Real world music object recognition.
Transactions of the International Society for Music Information Retrieval.
Verfügbar unter: https://doi.org/10.21256/zhaw-28644
-
Segessenman, Jan; Stadelmann, Thilo; Andrew, Davison; Oliver, Dürr,
2023.
Assessing deep learning : a work program for the humanities in the age of artificial intelligence.
SSRN.
Verfügbar unter: https://doi.org/10.21256/zhaw-28651
-
Luley, Paul-Philipp; Deriu, Jan Milan; Yan, Peng; Schatte, Gerrit A.; Stadelmann, Thilo,
2023.
From concept to implementation : the data-centric development process for AI in industry [Paper].
In:
2023 10th IEEE Swiss Conference on Data Science (SDS).
10th IEEE Swiss Conference on Data Science (SDS), Zurich, Switzerland, 22-23 June 2023.
IEEE.
S. 73-76.
Verfügbar unter: https://doi.org/10.1109/SDS57534.2023.00017
-
Emberger, Raphael; Boss, Jens Michael; Baumann, Daniel; Seric, Marko; Huo, Shufan; Tuggener, Lukas; Keller, Emanuela; Stadelmann, Thilo,
2023.
Video object detection for privacy-preserving patient monitoring in intensive care [Paper].
In:
2023 10th IEEE Swiss Conference on Data Science (SDS).
10th IEEE Swiss Conference on Data Science (SDS), Zurich, Switzerland, 22-23 June 2023.
IEEE.
S. 85-88.
Verfügbar unter: https://doi.org/10.1109/SDS57534.2023.00019
-
Amirian, Mohammadreza; Montoya-Zegarra, Javier A.; Herzig, Ivo; Eggenberger Hotz, Peter; Lichtensteiger, Lukas; Morf, Marco; Züst, Alexander; Paysan, Pascal; Peterlik, Igor; Scheib, Stefan; Füchslin, Rudolf Marcel; Stadelmann, Thilo; Schilling, Frank-Peter,
2023.
Medical Physics.
Verfügbar unter: https://doi.org/10.1002/mp.16405
Sonstige Veröffentlichungen
Wann | Art | Titel |
---|---|---|
2023 | Extended Abstract | Thilo Stadelmann. KI als Chance für die angewandten Wissenschaften im Wettbewerb der Hochschulen. Workshop (“Atelier”) at the Bürgenstock-Konferenz der Schweizer Fachhochschulen und Pädagogischen Hochschulen 2023, Luzern, Schweiz, 20. Januar 2023 |
2022 | Extended Abstract | Christoph von der Malsburg, Benjamin F. Grewe, and Thilo Stadelmann. Making Sense of the Natural Environment. Proceedings of the KogWis 2022 - Understanding Minds Biannual Conference of the German Cognitive Science Society, Freiburg, Germany, September 5-7, 2022. |
2022 | Open Research Data | Felix M. Schmitt-Koopmann, Elaine M. Huang, Hans-Peter Hutter, Thilo Stadelmann, und Alireza Darvishy. FormulaNet: Ein Benchmark-Datensatz für die Erkennung mathematischer Formeln. Eine ungelöste Teilaufgabe der Dokumentenanalyse ist die Erkennung mathematischer Formeln (MFD). Forschungen von uns und anderen haben gezeigt, dass bestehende MFD-Datensätze mit Inline- und Display-Formel-Etiketten klein sind und eine unzureichende Etikettierungsqualität aufweisen. Es besteht daher ein dringender Bedarf an Datensätzen mit besserer Beschriftungsqualität für die zukünftige Forschung im Bereich MFD, da diese einen großen Einfluss auf die Leistung der darauf trainierten Modelle haben. Wir stellen eine fortschrittliche Etikettierungspipeline und einen neuen Datensatz namens FormulaNet vor. Mit über 45.000 Seiten ist FormulaNet unserer Meinung nach der größte MFD-Datensatz mit Inline-Formelbeschriftungen. Unser Datensatz soll bei der Bewältigung der MFD-Aufgabe helfen und kann die Entwicklung neuer Anwendungen ermöglichen, wie z. B. die Zugänglichkeit mathematischer Formeln in PDFs für sehbehinderte Benutzer von Bildschirmlesegeräten. |
2020 | Open Research Data | Lukas Tuggener, Yvan Putra Satyawan, Alexander Pacha, Jürgen Schmidhuber, and Thilo Stadelmann, DeepScoresV2. The DeepScoresV2 Dataset for Music Object Detection contains digitally rendered images of written sheet music, together with the corresponding ground truth to fit various types of machine learning models. A total of 151 Million different instances of music symbols, belonging to 135 different classes are annotated. The total Dataset contains 255,385 Images. For most researches, the dense version, containing 1714 of the most diverse and interesting images, is a good starting point. |