IRRW: Skalierung des inversen Ansatzes zur Bildanalyse

Egger, Bernhard

doi:https://doi.org/10.34657/29177

IRRW: Skalierung des inversen Ansatzes zur Bildanalyse

Schlussbericht

Files

16IS22082_BMBF_Kurzbericht.pdf (49.55 KB)

16IS22082_BMBF_Abschlussbericht.pdf (175.43 KB)

Date

2026-02-04

Authors

Egger, Bernhard

Publisher

Hannover : Technische Informationsbibliothek

Supplementary Material

https://openreview.net/pdf?id=IOzjgYvxw1
https://arxiv.org/pdf/2510.13540
https://arxiv.org/pdf/2409.15466
https://arxiv.org/pdf/2404.03421
https://arxiv.org/pdf/2312.09780
https://arxiv.org/pdf/2410.21310
https://arxiv.org/pdf/2403.11865
https://arxiv.org/pdf/2211.16314
https://arxiv.org/pdf/2311.17232

Abstract

Computergestützte Lernverfahren zur Bildanalyse waren bereits zu Projektbeginn in bestimmten Anwendungsfeldern schneller oder zuverlässiger als Menschen. Die gleichen Verfahren scheiterten aber in komplexeren Umgebungen, insbesondere in Situationen, die während des Trainings nicht verfügbar waren. Solche Verfahren werden auch heute noch hauptsächlich mit enormen Datenmengen und manuellen Annotationen trainiert. Das Projekt baute darauf auf, dass die computergestützte Bildanalyse und insbesondere deren Generalisierung nicht ausschließlich als Lernproblem angesehen werden darf, sondern stark von dateneffizienten Ansätzen profitieren kann, um die automatische Verarbeitung in komplexeren Umgebungen zu verwirklichen und eine Generalisierung ermöglichen. In diesem interdisziplinären Projekt haben wir einen Ansatz verfolgt, der die bestehenden Limitierungen basierend auf generativen Modellen und einem inversen Ansatz angeht. Inverse Methoden zur Bildanalyse zielen darauf ab, alle Teile der Szene zu rekonstruieren. Dieses beinhaltet die 3D Form der Objekte, ihre Materialeigenschaften, die Position sowie die Beleuchtung. Zu Projektbeginn existierende inverse Ansätze funktionierten für einzelne Objekte oder auf synthetischen Daten, aber bisher nicht ausreichend in komplexen und realistischen Umgebungen. Die Theorie von David Marr postuliert, dass dies im Menschen in einem Objekt-spezifischen und einem Objekt-agnostischen Schritt abläuft. Wir haben erstmals neuronale Evidenz für diese Hypothese und möchten in diesem Projekt zeigen, dass diese Separierung elementar ist, um inverse Methoden auf echte Bilder anwenden zu können.

Publication Type

Report

Version

publishedVersion

URI

https://oa.tib.eu/renate/handle/123456789/30108
https://doi.org/10.34657/29177

Collections

Forschungsberichte Pflichtabgabe (BMFTR, BMWE…)

License

Creative Commons Attribution-NonDerivs 3.0 Germany

https://creativecommons.org/licenses/by-nd/3.0/de/

Full item page

IRRW: Skalierung des inversen Ansatzes zur Bildanalyse

Files

Date

Authors

Editor

Advisor

Volume

Issue

Journal

Series Titel

Book Title

Publisher

Supplementary Material

Other Versions

Link to publishers' Version

Abstract

Description

Keywords

Keywords GND

Conference

Publication Type

Version

URI

Collections

License