Computer Vision, Perception and Cognition Group

«KI ist DIE Schlüsseltechnologie des digitalen Wandels in allen Branchen und Sektoren und sie hat starke Auswirkungen auf unsere Gesellschaften. Darum leistet unsere Forschung wichtige Beiträge zu robusten und vertrauenswürdigen KI-Methoden, und wir vermitteln mit Begeisterung deren sichere Umsetzung und Anwendung.»
Expertise

- Mustererkennung mit Deep Learning
- Maschinelle Wahrnehmung, Computer Vision und Sprechererkennung
- Entwicklung neuronaler Systeme
Die Computer Vision, Perception and Cognition-Gruppe forscht über Mustererkennung und arbeitet an einer Vielzahl von Aufgaben mit Bild-, Ton- oder allgemein Signaldaten. Wir befassen uns mit der Methodik der tiefen neuronalen Netze (Deep Neural Networks) und des Reinforcement Learning, inspiriert durch biologisches Lernen. Jede unserer Aufgaben hat ihr eigenes Lernziel (z. B. Erkennung, Klassifizierung, Clustering, Segmentierung, Novelty Detection, Steuerung) und ihren eigenen Anwendungsfall (z. B. vorausschauende Instandhaltung (Predictive Maintenance), Sprechererkennung für Multimedia-Indizierung, Dokumentanalyse, optische Notenerkennung, Computer Vision für industrielle Qualitätskontrolle, automatisiertes maschinelles Lernen, Deep Reinforcement Learning für automatisierte Spiele oder Gebäudeleittechnik). Diese werfen ihrerseits ein Licht auf verschiedene Aspekte des Lernprozesses. Wir nutzen diese Erfahrungen, um allgemeinere KI-Systeme zu kreieren, die auf neuronalen Architekturen basieren.
Angebote
- Einblick: Keynotes, Trainings
- KI-Beratung: Workshops, Expertenunterstützung, Beratung, Technikfolgenabschätzung
- Forschung und Entwicklung: kleine bis grosse Gemeinschaftsprojekte, Drittmittelforschung, studentische Projekte, praxiserprobte Prototypen
Team
Head of Research Group
Projekte
-
FWA: Visual Food Waste Analysis for Sustainable Kitchens
Ein neuartiger Ansatz für die vollautomatische Analyse von Lebensmittelabfällen für Großküchen wird untersucht. Lebensmittelabfälle werden mit einer neuen Kameraeinrichtung automatisch erkannt, in Echtzeit analysiert und mit Hilfe von maschinellen Lernalgorithmen klassifiziert.
-
Machbarkeitsstudie Reinforcement Learning Control für Heizsysteme
Wir schaffen die wissenschaftlichen Grundlagen für den Einsatz selbstlernender Energiemanagementsysteme für Gebäude mit heterogenen Energiesystemen und zeitlich variablem Nutzerverhalten. Eine solche Steuerung ermöglicht es, dauerhaft optimal arbeitende Energiesysteme auch für ältere Gebäude mit nur teilweise ...
-
Radiosands
Radiosands ist eine begehbare Installation, in der mehrere gleichzeitig stattfindende Radiosendungen analysiert und neu zusammengesetzt werden. Die Installation nutzt die Geschwindigkeit und algorithmische Potenz digitaler Technik, um eine neue Erfahrung zu schaffen: Eine Echtzeit-Collage von klanglichen Fragmenten, ...
-
Ada – Advanced Algorithms for an Artificial Data Analyst
Ada - the Artificial Data Analyst - raises the productivity of data science endeavours by applying data science to itself: we apply empirical optimization also to algorithm and feature selection. Recent developments, e.g. from the MIT, are thus made available as a data product for Swiss industry. ...
-
QualitAI - Quality control of industrial products via deep learning on images
Mit dem Projekt QualitAI wird eine vollautomatische Qualitätskontrollanlage realisiert. Die Anlage wird in der medizinaltechnischen Nische der Ballonkatheter auf den Markt gebracht.Die Anlage kann die heutigen Prozesse stark vereinfachen und beschleunigen. Durch eine Vollautomatisierung und das Ersetzen von heute ...
-
FarmAI – Künstliche Intelligenz für den Farming Simulator
Für die weltweit erfolgreiche Videospiel-Serie “Farming Simulator” von GIANTS Software GmbH wird mittels künstlicher Intelligenz (KI) ein neuer, langfristig unterhaltender, einfach erweiterbarer Spielmodus ermöglicht. In diesem Projekt werden Reinforcement Learning Algorithmen eingesetzt, um geeignete ...
-
Libra: A One-Tool Solution for MLD4 Compliance
Compared with earlier regulations, the 4th European Money Laundering Directive (MLD4) imposes rigorously increased requirements. It compels obliged entities to conduct in depth screenings of customers and their associations. The Libra Project aims at providing a one tool solution for meeting MLD4 compliance. The ...
-
DeepText: Intelligente Textanalyse mit Deep Learning
DeepText entwickelt ein Software-Framework, mit dem automatisch Texte analysiert werden können, um wichtige Informationen zu extrahieren. Das Framework basiert auf modernen Algorithmen aus dem Maschinellen Lernen (Deep Learning), die Texte besser analysieren können als traditionelle Methoden. Damit kann man z.B. die ...
-
DeLLA: Deep-Learning-basierter Spracherkenner mit beschränkten Trainingsdaten
Spracherkennung basierend auf Deep Neural Networks (DNNs) bricht aktuell alle Rekorde und hat bereits Eingang in verschiedene Produkte gefunden. Solche Systeme wurden mit tausenden Stunden Sprachmaterial trainiert für Anwendungen/Sprachen, wo entsprechend riesige annotierte Datenmengen verfügbar sind. In dieser ...
-
DeepScore: Digitales Notenpult mit musikalischem Verständnis durch Active Sheet Technologie
Das Produkt ScorePad ist ein digitales Notenpult für Tablets professioneller Musiker. Es macht gedruckte Noten überflüssig und bietet wesentliche Vereinfachungen im Notenhandling sowie neue Kollaborationsfunktionen für Ensembles. Ermöglicht wird dies durch die im DeepScore Projekt zu entwickelnde „Active Sheet“ ...
Publikationen
-
Meier, Benjamin Bruno; Elezi, Ismail; Amirian, Mohammadreza; Dürr, Oliver; Stadelmann, Thilo,
2018.
Learning neural models for end-to-end clustering [Paper].
In:
Proceedings of the 8th IAPR TC3 Workshop on Artificial Neural Networks in Pattern Recognition (ANNPR).
8th IAPR TC3 Workshop on Artificial Neural Networks in Pattern Recognition (ANNPR), Siena, Italy, 19-21 September 2018.
IAPR.
Verfügbar unter: https://doi.org/10.21256/zhaw-3850
-
Hibraj, Feliks; Vascon, Sebastiano; Stadelmann, Thilo; Pelillo, Marcello,
2018.
Speaker clustering using dominant sets [Paper].
In:
Proceedings of the 24th International Conference on Pattern Recognition (ICPR 2018).
24th International Conference on Pattern Recognition (ICPR 2018), Beijing, China, 20-28 August 2018.
Beijing:
IAPR.
S. 1-6.
Verfügbar unter: https://doi.org/10.21256/zhaw-4254
-
Amirian, Mohammadreza; Schwenker, Friedhelm; Stadelmann, Thilo,
2018.
Trace and detect adversarial attacks on CNNs using feature response maps [Paper].
In:
Proceedings of the 8th IAPR TC3 Workshop on Artificial Neural Networks in Pattern Recognition (ANNPR).
8th IAPR TC3 Workshop on Artificial Neural Networks in Pattern Recognition (ANNPR), Siena, Italy, 19-21 September 2018.
IAPR.
Verfügbar unter: https://doi.org/10.21256/zhaw-3863
-
Meier, Benjamin; Stadelmann, Thilo; Stampfli, Jan; Arnold, Marek; Cieliebak, Mark,
2017.
Fully convolutional neural networks for newspaper article segmentation [Paper].
In:
Proceedings of the 14th IAPR International Conference on Document Analysis and Recognition (ICDAR).
14th IAPR International Conference on Document Analysis and Recognition (ICDAR 2017), Kyoto Japan, 13-15 November 2017.
Kyoto, Japan:
CPS.
Verfügbar unter: https://doi.org/10.21256/zhaw-1533
-
Lukic, Yanick X.; Vogt, Carlo; Dürr, Oliver; Stadelmann, Thilo,
2017.
Learning embeddings for speaker clustering based on voice equality [Paper].
In:
2017 IEEE 27th International Workshop on Machine Learning for Signal Processing (MLSP).
27th IEEE International Workshop on Machine Learning for Signal Processing (MLSP 2017), Tokyo, 25-28 September 2017.
IEEE.
Verfügbar unter: https://doi.org/10.1109/MLSP.2017.8168166