Eingabe löschen

Hauptnavigation

CAI-Forschung in den Top Fachzeitschriften JAIR and Neural Computation zur Veröffentlichung akzeptiert

Das Centre for Artificial Intelligence (CAI) veröffentlicht innovative Ergebnisse, die von neuro-inspirierter KI-Grundlagenforschung bis hin zu KI-Agenten für die autonome Computersteuerung reichen.

In Zusammenarbeit mit dem Grewe-Lab der Universität Zürich und ETH Zürich hat das Centre for Artificial Intelligence (CAI) kürzlich zwei neue Forschungsartikel veröffentlicht, die verschiedene Aspekte der künstlichen Intelligenz beleuchten - von theoretischen Modellen der Bildverarbeitung bis hin zur Analyse angewandter autonomer Systeme.

In der Arbeit «The Cooperative Network Architecture: Learning Structured Networks as Representation of Sensory Patterns», erschienen in Neural Computation, präsentieren Pascal Sager und Kolleginnen und Kollegen einen gehirninspirierten Ansatz zur visuellen Repräsentationsbildung. Die vorgeschlagene Cooperative Network Architecture modelliert sensorische Eingaben nicht als statische Pixelarrays, sondern als strukturierte Netzwerke aus überlappenden neuronalen Fragmenten. Das Lernen erfolgt über hebbsche Plastizität, wodurch statistische Regelmässigkeiten in visuellen Daten erfasst werden können. Die Ergebnisse zeigen eine erhöhte Robustheit gegenüber Rauschen sowie eine verbesserte Generalisierungsfähigkeit auf unbekannte Muster ohne den Einsatz überwachter Lernverfahren.

In einer zweiten Veröffentlichung mit dem Titel «A Comprehensive Survey of Agents for Computer Use: Foundations, Challenges, and Future Directions», erschienen im Journal of Artificial Intelligence Research, analysieren Pascal Sager und Benjamin Meyer mit Kolleginnen und Kollegen das sich dynamisch entwickelnde Forschungsfeld der Agenten zur Computer-Steuerung. Diese Systeme sind darauf ausgelegt, komplexe Aufgaben auf digitalen Geräten auszuführen, indem sie Software über menschenähnliche Interaktionen wie Mausbewegungen, Klicks oder Gesten bedienen.

Die Übersicht bietet einen strukturierten Überblick über bestehende Ansätze und identifiziert zentrale Trends des Forschungsfeldes, darunter den Übergang von stark spezialisierten textbasierten Agenten hin zu Systemen auf Basis grosser Foundation Models mit visuellen Wahrnehmungs-fähigkeiten. Durch die Auswertung zahlreicher wissenschaftlicher Arbeiten, Datensätze und Benchmarks heben die Autorinnen und Autoren wesentliche Einschränkungen aktueller Methoden hervor, etwa begrenzte Planungsfähigkeiten, fehleranfällige Ausführung und das Fehlen standardisierter Evaluationsverfahren. Abschliessend diskutiert die Arbeit offene Herausforderungen und mögliche Richtungen für zukünftige Forschung.

Zusammen zeigen die beiden Publikationen die thematische Breite der Forschung innerhalb des CAI und leisten Beiträge sowohl zu grundlegenden Fragestellungen der neuronalen Repräsentationsbildung als auch zu praktischen Herausforderungen bei der Entwicklung und Bewertung autonomer Softwareagenten.