Computer Vision, Perception and Cognition Group

«KI ist DIE Schlüsseltechnologie des digitalen Wandels in allen Branchen und Sektoren und sie hat starke Auswirkungen auf unsere Gesellschaften. Darum leistet unsere Forschung wichtige Beiträge zu robusten und vertrauenswürdigen KI-Methoden, und wir vermitteln mit Begeisterung deren sichere Umsetzung und Anwendung.»
Expertise

- Mustererkennung mit Deep Learning
- Maschinelle Wahrnehmung, Computer Vision und Sprechererkennung
- Entwicklung neuronaler Systeme
Die Computer Vision, Perception and Cognition-Gruppe forscht über Mustererkennung und arbeitet an einer Vielzahl von Aufgaben mit Bild-, Ton- oder allgemein Signaldaten. Wir befassen uns mit der Methodik der tiefen neuronalen Netze (Deep Neural Networks) und des Reinforcement Learning, inspiriert durch biologisches Lernen. Jede unserer Aufgaben hat ihr eigenes Lernziel (z. B. Erkennung, Klassifizierung, Clustering, Segmentierung, Novelty Detection, Steuerung) und ihren eigenen Anwendungsfall (z. B. vorausschauende Instandhaltung (Predictive Maintenance), Sprechererkennung für Multimedia-Indizierung, Dokumentanalyse, optische Notenerkennung, Computer Vision für industrielle Qualitätskontrolle, automatisiertes maschinelles Lernen, Deep Reinforcement Learning für automatisierte Spiele oder Gebäudeleittechnik). Diese werfen ihrerseits ein Licht auf verschiedene Aspekte des Lernprozesses. Wir nutzen diese Erfahrungen, um allgemeinere KI-Systeme zu kreieren, die auf neuronalen Architekturen basieren.
Angebote
- Einblick: Keynotes, Trainings
- KI-Beratung: Workshops, Expertenunterstützung, Beratung, Technikfolgenabschätzung
- Forschung und Entwicklung: kleine bis grosse Gemeinschaftsprojekte, Drittmittelforschung, studentische Projekte, praxiserprobte Prototypen
Team
Head of Research Group
Projekte
-
FWA: Visual Food Waste Analysis for Sustainable Kitchens
Ein neuartiger Ansatz für die vollautomatische Analyse von Lebensmittelabfällen für Großküchen wird untersucht. Lebensmittelabfälle werden mit einer neuen Kameraeinrichtung automatisch erkannt, in Echtzeit analysiert und mit Hilfe von maschinellen Lernalgorithmen klassifiziert.
-
Machbarkeitsstudie Reinforcement Learning Control für Heizsysteme
Wir schaffen die wissenschaftlichen Grundlagen für den Einsatz selbstlernender Energiemanagementsysteme für Gebäude mit heterogenen Energiesystemen und zeitlich variablem Nutzerverhalten. Eine solche Steuerung ermöglicht es, dauerhaft optimal arbeitende Energiesysteme auch für ältere Gebäude mit nur teilweise ...
-
Radiosands
Radiosands ist eine begehbare Installation, in der mehrere gleichzeitig stattfindende Radiosendungen analysiert und neu zusammengesetzt werden. Die Installation nutzt die Geschwindigkeit und algorithmische Potenz digitaler Technik, um eine neue Erfahrung zu schaffen: Eine Echtzeit-Collage von klanglichen Fragmenten, ...
-
Ada – Advanced Algorithms for an Artificial Data Analyst
Ada - the Artificial Data Analyst - raises the productivity of data science endeavours by applying data science to itself: we apply empirical optimization also to algorithm and feature selection. Recent developments, e.g. from the MIT, are thus made available as a data product for Swiss industry. ...
-
QualitAI - Quality control of industrial products via deep learning on images
Mit dem Projekt QualitAI wird eine vollautomatische Qualitätskontrollanlage realisiert. Die Anlage wird in der medizinaltechnischen Nische der Ballonkatheter auf den Markt gebracht.Die Anlage kann die heutigen Prozesse stark vereinfachen und beschleunigen. Durch eine Vollautomatisierung und das Ersetzen von heute ...
-
FarmAI – Künstliche Intelligenz für den Farming Simulator
Für die weltweit erfolgreiche Videospiel-Serie “Farming Simulator” von GIANTS Software GmbH wird mittels künstlicher Intelligenz (KI) ein neuer, langfristig unterhaltender, einfach erweiterbarer Spielmodus ermöglicht. In diesem Projekt werden Reinforcement Learning Algorithmen eingesetzt, um geeignete ...
-
Libra: A One-Tool Solution for MLD4 Compliance
Compared with earlier regulations, the 4th European Money Laundering Directive (MLD4) imposes rigorously increased requirements. It compels obliged entities to conduct in depth screenings of customers and their associations. The Libra Project aims at providing a one tool solution for meeting MLD4 compliance. The ...
-
DeepText: Intelligente Textanalyse mit Deep Learning
DeepText entwickelt ein Software-Framework, mit dem automatisch Texte analysiert werden können, um wichtige Informationen zu extrahieren. Das Framework basiert auf modernen Algorithmen aus dem Maschinellen Lernen (Deep Learning), die Texte besser analysieren können als traditionelle Methoden. Damit kann man z.B. die ...
-
DeLLA: Deep-Learning-basierter Spracherkenner mit beschränkten Trainingsdaten
Spracherkennung basierend auf Deep Neural Networks (DNNs) bricht aktuell alle Rekorde und hat bereits Eingang in verschiedene Produkte gefunden. Solche Systeme wurden mit tausenden Stunden Sprachmaterial trainiert für Anwendungen/Sprachen, wo entsprechend riesige annotierte Datenmengen verfügbar sind. In dieser ...
-
DeepScore: Digitales Notenpult mit musikalischem Verständnis durch Active Sheet Technologie
Das Produkt ScorePad ist ein digitales Notenpult für Tablets professioneller Musiker. Es macht gedruckte Noten überflüssig und bietet wesentliche Vereinfachungen im Notenhandling sowie neue Kollaborationsfunktionen für Ensembles. Ermöglicht wird dies durch die im DeepScore Projekt zu entwickelnde „Active Sheet“ ...
Publikationen
-
Elezi, Ismail; Tuggener, Lukas; Pelillo, Marcello; Stadelmann, Thilo,
2018.
DeepScores and Deep Watershed Detection : current state and open issues [Paper].
In:
Proceedings of the 1st International Workshop on Reading Music Systems.
1st International Workshop on Reading Music Systems at ISMIR 2018, Paris, France, 20 September 2018.
Paris:
Society for Music Information Retrieval.
S. 13-14.
Verfügbar unter: https://doi.org/10.21256/zhaw-4777
-
Stadelmann, Thilo; Glinski-Haefeli, Sebastian; Gerber, Patrick; Dürr, Oliver,
2018.
Capturing suprasegmental features of a voice with RNNs for improved speaker clustering [Paper].
In:
Proceedings of the 8th IAPR TC3 Workshop on Artificial Neural Networks in Pattern Recognition (ANNPR).
8th IAPR TC3 Workshop on Artificial Neural Networks in Pattern Recognition (ANNPR), Siena, Italy, 19-21 September 2018.
IAPR.
S. 333-345.
Lecture Notes in Computer Science ; 11081.
Verfügbar unter: https://doi.org/10.1007/978-3-319-99978-4_26
-
Stadelmann, Thilo; Amirian, Mohammadreza; Arabaci, Ismail; Arnold, Marek; Duivesteijn, Gilbert François; Elezi, Ismail; Geiger, Melanie; Lörwald, Stefan; Meier, Benjamin Bruno; Rombach, Katharina; Tuggener, Lukas,
2018.
Deep learning in the wild [Paper].
In:
Proceedings of the 8th IAPR TC3 Workshop on Artificial Neural Networks in Pattern Recognition (ANNPR).
8th IAPR TC3 Workshop on Artificial Neural Networks in Pattern Recognition (ANNPR), Siena, Italy, 19-21 September 2018.
IAPR.
Verfügbar unter: https://doi.org/10.21256/zhaw-3872
-
Tuggener, Lukas; Elezi, Ismail; Schmidhuber, Jürgen; Stadelmann, Thilo,
2018.
Deep watershed detector for music object recognition [Paper].
In:
Proceedings of the 19th International Society for Music Information Retrieval Conference.
19th International Society for Music Information Retrieval Conference, Paris, 23-27 September 2018.
Paris:
Society for Music Information Retrieval.
Verfügbar unter: https://doi.org/10.21256/zhaw-3760
-
Tuggener, Lukas; Elezi, Ismail; Schmidhuber, Jürgen; Pelillo, Marcello; Stadelmann, Thilo,
2018.
DeepScores : a dataset for segmentation, detection and classification of tiny objects [Paper].
In:
Proceedings of the 24th International Conference on Pattern Recognition.
24th International Conference on Pattern Recognition (ICPR 2018), Beijing, China, 20-28 August 2018.
Beijing:
IAPR.
S. 1-6.
Verfügbar unter: https://doi.org/10.21256/zhaw-4255