
Wie die Beteiligten betonen, reproduziert das Modell zahlreiche etablierte Verhaltens- und Wahrnehmungsphänomene der Psychologie und Neurophysiologie, ohne dass sie explizit programmiert wurden. Dieses erweiterte nicht nur das Verständnis der menschlichen visuellen Wahrnehmung, sondern biete auch eine neue Perspektive und ein neues Rahmenwerk für KI-Forschende, schreibt die Technische Universität Berlin in einer Pressemitteilung. Die Arbeit wurde nun in der Fachzeitschrift Nature Communications veröffentlicht.
Die Wissenschaftler stellen einen neurowissenschaftlich inspirierten Ansatz vor, der gleich mehrere Formen der Aufmerksamkeit in einem einzigen Modell vereint: räumlich, objektbasiert und ‚feature-basiert‘, also auf Eigenschaften bezogen. Die Arbeit adressiert damit eines der zentralen ungelösten Probleme der kognitiven Neurowissenschaft, das sogenannte Binding Problem: Dieses besagt, dass menschliche Sinnesorgane ununterbrochen Informationen aufnehmen – weit mehr, als das Gehirn prozessieren kann. Dennoch können Menschen sich mühelos auf die Verbindung der wichtigsten Informationen, wie etwa eine rote Ampel beim Autofahren, konzentrieren. Diese Fähigkeit wird als Aufmerksamkeit bezeichnet. Sie ermöglicht es dem Gehirn, aus einer Fülle von Informationen die relevanten auszuwählen oder auch verschiedene visuelle Merkmale zu einzelnen Objekten zu verbinden und so das Verhalten zu steuern. Doch wie das Gehirn die relevanten Informationen verarbeitet, ist noch nicht völlig geklärt.
Psycho-physikalische Effekte reproduziert
„Das entwickelte Modell ist in der Lage, die charakteristischen Verhaltensweisen der menschlichen Aufmerksamkeit erfolgreich auszuführen: Orientierung, Filterung und visuelle Suche in komplexen visuellen Szenen“, erklärt Saeed Salehi, Wissenschaftler aus dem Team von Bifold-Co-Direktor Prof. Dr. Klaus-Robert Müller. Das System meistert sowohl Erkennungs- und Unterteilungs-Aufgaben als auch klassische Aufmerksamkeitsleistungen wie Orientierung auf relevante Reize, Filterung störender Informationen und zielgerichtete Suche. In der industriellen Bildverarbeitung stellen PC-basierte Systeme oft eine technische Hürde dar. Die Trennung von Bildaufnahme und Datenverarbeitung führt häufig zu Latenzen, erhöhtem Platzbedarf und einem komplexen Wartungsaufwand. Besonders in schnellen Produktionslinien erschwert die Synchronisation zwischen Sensor und externem Rechner eine stabile Prozesskontrolle. ‣ weiterlesen
Präzise 2D-Inspektion mit nativer Edge-Intelligenz
In Experimenten demonstriert das Team, dass das Modell nicht nur Objekterkennung in komplexen Szenen verbessert, sondern auch psycho-physikalische Effekte wie die sogenannte Wahrnehmungsbelastung und die Aufmerksamkeitsblindheit repliziert. Die internen Einheiten des Modells entwickeln neuronale Eigenschaften, die mit der Primatenphysiologie übereinstimmen. „Aufmerksamkeit, Objektwahrnehmung und Verbindung von Reizen gehören zu den wichtigsten Fähigkeiten des Gehirns. Diese in die Praxis für KI-Architekturen einzubringen, birgt großes Potenzial“, so Klaus-Robert Müller.
Neuronale Netze sollen dem Gehirn ähnlicher werden
„Neuronale Netze verarbeiten Informationen im Allgemeinen nur in eine Richtung, das Gehirn hingegen ist bidirektional. Neuronale Netze haben nur eine Aufgabe: Informationen zu extrahieren. Das Gehirn hingegen leistet eine Vielzahl von Aufgaben, sowohl bottom-up als auch top-down. Unser Ziel ist es, neuronale Netze gehirnähnlicher zu gestalten und dadurch neue Gehirn- und KI-Modelle zu entwickeln“, erklärt Konrad Kording, Penn Integrated Knowledge Professor, University of Pennsylvania sowie Co-Director des ‚CIFAR Learning in Machines & Brains Program‘.
Weitreichende Folgen
Die praktischen Folgen der vorgestellten Arbeit könnten nach Ansicht der Forschenden weitreichend sein, sowohl für die Neurowissenschaften als auch für die KI-Forschung. Denn durch die Verknüpfung von Erkenntnissen aus Psychologie, Neurowissenschaften und Computermodellierung erweitere die Studie das Verständnis der Funktionsweise von Aufmerksamkeit und Objektwahrnehmung im Gehirn. Sie stellt einen Schritt dar hin zu besseren Modellen der menschlichen Kognition und eröffnet Anwendungsmöglichkeiten, die von der Diagnose visueller Aufmerksamkeitsstörungen bis hin zur Entwicklung neuartiger adaptiver KI-Architekturen reichen.














