IRRW: Skalierung des inversen Ansatzes zur Bildanalyse
Date
Authors
Volume
Issue
Journal
Series Titel
Book Title
Publisher
Link to publishers version
Abstract
Computergestützte Lernverfahren zur Bildanalyse waren bereits zu Projektbeginn in bestimmten Anwendungsfeldern schneller oder zuverlässiger als Menschen. Die gleichen Verfahren scheiterten aber in komplexeren Umgebungen, insbesondere in Situationen, die während des Trainings nicht verfügbar waren. Solche Verfahren werden auch heute noch hauptsächlich mit enormen Datenmengen und manuellen Annotationen trainiert. Das Projekt baute darauf auf, dass die computergestützte Bildanalyse und insbesondere deren Generalisierung nicht ausschließlich als Lernproblem angesehen werden darf, sondern stark von dateneffizienten Ansätzen profitieren kann, um die automatische Verarbeitung in komplexeren Umgebungen zu verwirklichen und eine Generalisierung ermöglichen. In diesem interdisziplinären Projekt haben wir einen Ansatz verfolgt, der die bestehenden Limitierungen basierend auf generativen Modellen und einem inversen Ansatz angeht. Inverse Methoden zur Bildanalyse zielen darauf ab, alle Teile der Szene zu rekonstruieren. Dieses beinhaltet die 3D Form der Objekte, ihre Materialeigenschaften, die Position sowie die Beleuchtung. Zu Projektbeginn existierende inverse Ansätze funktionierten für einzelne Objekte oder auf synthetischen Daten, aber bisher nicht ausreichend in komplexen und realistischen Umgebungen. Die Theorie von David Marr postuliert, dass dies im Menschen in einem Objekt-spezifischen und einem Objekt-agnostischen Schritt abläuft. Wir haben erstmals neuronale Evidenz für diese Hypothese und möchten in diesem Projekt zeigen, dass diese Separierung elementar ist, um inverse Methoden auf echte Bilder anwenden zu können.
