Computer Vision, Perception and Cognition Group

«KI ist DIE Schlüsseltechnologie des digitalen Wandels in allen Branchen und Sektoren und sie hat starke Auswirkungen auf unsere Gesellschaften. Darum leistet unsere Forschung wichtige Beiträge zu robusten und vertrauenswürdigen KI-Methoden, und wir vermitteln mit Begeisterung deren sichere Umsetzung und Anwendung.»
Expertise

- Mustererkennung mit Deep Learning
- Maschinelle Wahrnehmung, Computer Vision und Sprechererkennung
- Entwicklung neuronaler Systeme
Die Computer Vision, Perception and Cognition-Gruppe forscht über Mustererkennung und arbeitet an einer Vielzahl von Aufgaben mit Bild-, Ton- oder allgemein Signaldaten. Wir befassen uns mit der Methodik der tiefen neuronalen Netze (Deep Neural Networks) und des Reinforcement Learning, inspiriert durch biologisches Lernen. Jede unserer Aufgaben hat ihr eigenes Lernziel (z. B. Erkennung, Klassifizierung, Clustering, Segmentierung, Novelty Detection, Steuerung) und ihren eigenen Anwendungsfall (z. B. vorausschauende Instandhaltung (Predictive Maintenance), Sprechererkennung für Multimedia-Indizierung, Dokumentanalyse, optische Notenerkennung, Computer Vision für industrielle Qualitätskontrolle, automatisiertes maschinelles Lernen, Deep Reinforcement Learning für automatisierte Spiele oder Gebäudeleittechnik). Diese werfen ihrerseits ein Licht auf verschiedene Aspekte des Lernprozesses. Wir nutzen diese Erfahrungen, um allgemeinere KI-Systeme zu kreieren, die auf neuronalen Architekturen basieren.
Angebote
- Einblick: Keynotes, Trainings
- KI-Beratung: Workshops, Expertenunterstützung, Beratung, Technikfolgenabschätzung
- Forschung und Entwicklung: kleine bis grosse Gemeinschaftsprojekte, Drittmittelforschung, studentische Projekte, praxiserprobte Prototypen
Team
Head of Research Group
Projekte
-
FWA: Visual Food Waste Analysis for Sustainable Kitchens
Ein neuartiger Ansatz für die vollautomatische Analyse von Lebensmittelabfällen für Großküchen wird untersucht. Lebensmittelabfälle werden mit einer neuen Kameraeinrichtung automatisch erkannt, in Echtzeit analysiert und mit Hilfe von maschinellen Lernalgorithmen klassifiziert.
-
Machbarkeitsstudie Reinforcement Learning Control für Heizsysteme
Wir schaffen die wissenschaftlichen Grundlagen für den Einsatz selbstlernender Energiemanagementsysteme für Gebäude mit heterogenen Energiesystemen und zeitlich variablem Nutzerverhalten. Eine solche Steuerung ermöglicht es, dauerhaft optimal arbeitende Energiesysteme auch für ältere Gebäude mit nur teilweise ...
-
Radiosands
Radiosands ist eine begehbare Installation, in der mehrere gleichzeitig stattfindende Radiosendungen analysiert und neu zusammengesetzt werden. Die Installation nutzt die Geschwindigkeit und algorithmische Potenz digitaler Technik, um eine neue Erfahrung zu schaffen: Eine Echtzeit-Collage von klanglichen Fragmenten, ...
-
Ada – Advanced Algorithms for an Artificial Data Analyst
Ada - the Artificial Data Analyst - raises the productivity of data science endeavours by applying data science to itself: we apply empirical optimization also to algorithm and feature selection. Recent developments, e.g. from the MIT, are thus made available as a data product for Swiss industry. ...
-
QualitAI - Quality control of industrial products via deep learning on images
Mit dem Projekt QualitAI wird eine vollautomatische Qualitätskontrollanlage realisiert. Die Anlage wird in der medizinaltechnischen Nische der Ballonkatheter auf den Markt gebracht.Die Anlage kann die heutigen Prozesse stark vereinfachen und beschleunigen. Durch eine Vollautomatisierung und das Ersetzen von heute ...
-
FarmAI – Künstliche Intelligenz für den Farming Simulator
Für die weltweit erfolgreiche Videospiel-Serie “Farming Simulator” von GIANTS Software GmbH wird mittels künstlicher Intelligenz (KI) ein neuer, langfristig unterhaltender, einfach erweiterbarer Spielmodus ermöglicht. In diesem Projekt werden Reinforcement Learning Algorithmen eingesetzt, um geeignete ...
-
Libra: A One-Tool Solution for MLD4 Compliance
Compared with earlier regulations, the 4th European Money Laundering Directive (MLD4) imposes rigorously increased requirements. It compels obliged entities to conduct in depth screenings of customers and their associations. The Libra Project aims at providing a one tool solution for meeting MLD4 compliance. The ...
-
DeepText: Intelligente Textanalyse mit Deep Learning
DeepText entwickelt ein Software-Framework, mit dem automatisch Texte analysiert werden können, um wichtige Informationen zu extrahieren. Das Framework basiert auf modernen Algorithmen aus dem Maschinellen Lernen (Deep Learning), die Texte besser analysieren können als traditionelle Methoden. Damit kann man z.B. die ...
-
DeLLA: Deep-Learning-basierter Spracherkenner mit beschränkten Trainingsdaten
Spracherkennung basierend auf Deep Neural Networks (DNNs) bricht aktuell alle Rekorde und hat bereits Eingang in verschiedene Produkte gefunden. Solche Systeme wurden mit tausenden Stunden Sprachmaterial trainiert für Anwendungen/Sprachen, wo entsprechend riesige annotierte Datenmengen verfügbar sind. In dieser ...
-
DeepScore: Digitales Notenpult mit musikalischem Verständnis durch Active Sheet Technologie
Das Produkt ScorePad ist ein digitales Notenpult für Tablets professioneller Musiker. Es macht gedruckte Noten überflüssig und bietet wesentliche Vereinfachungen im Notenhandling sowie neue Kollaborationsfunktionen für Ensembles. Ermöglicht wird dies durch die im DeepScore Projekt zu entwickelnde „Active Sheet“ ...
Publikationen
-
Tuggener, Lukas; Amirian, Mohammadreza; Benites de Azevedo e Souza, Fernando; von Däniken, Pius; Gupta, Prakhar; Schilling, Frank-Peter; Stadelmann, Thilo,
2020.
Design patterns for resource-constrained automated deep-learning methods.
AI.
1(4), S. 510-538.
Verfügbar unter: https://doi.org/10.3390/ai1040031
-
Tuggener, Lukas; Satyawan, Yvan Putra; Pacha, Alexander; Schmidhuber, Jürgen; Stadelmann, Thilo,
2020.
The DeepScoresV2 dataset and benchmark for music object detection [Paper].
In:
Proceedings of the 25th International Conference on Pattern Recognition 2020 (ICPR’20).
25th International Conference on Pattern Recognition 2020 (ICPR’20), Online, 10-15 January 2021.
IAPR.
Verfügbar unter: https://doi.org/10.21256/zhaw-20647
-
Glüge, Stefan; Amirian, Mohammadreza; Flumini, Dandolo; Stadelmann, Thilo,
2020.
How (not) to measure bias in face recognition networks [Paper].
In:
Schilling, Frank-Peter; Stadelmann, Thilo, Hrsg.,
Artificial Neural Networks in Pattern Recognition.
9th IAPR TC 3 Workshop on Artificial Neural Networks for Pattern Recognition (ANNPR'20), Winterthur, Switzerland, 2-4 September 2020.
Cham:
Springer.
Lecture Notes in Computer Science ; 12294.
Verfügbar unter: https://doi.org/10.1007/978-3-030-58309-5_10
-
Schilling, Frank-Peter; Stadelmann, Thilo, Hrsg.,
2020.
9th IAPR TC 3 Workshop on Artificial Neural Networks for Pattern Recognition (ANNPR'20), Winterthur, Switzerland, 2-4 September 2020.
Springer.
Lecture Notes in Computer Science ; 12294.
ISBN 978-3-030-58308-8.
Verfügbar unter: https://doi.org/10.1007/978-3-030-58309-5
-
Roost, Dano; Meier, Ralph; Toffetti Carughi, Giovanni; Stadelmann, Thilo,
2020.
Combining reinforcement learning with supervised deep learning for neural active scene understanding [Paper].
In:
Active Vision and Perception in Human(-Robot) Collaboration Workshop at IEEE RO-MAN 2020 (AVHRC’20), online, 31 August - 4 September 2020.
University of Essex.
Verfügbar unter: https://doi.org/10.21256/zhaw-20419