R3DR - Robuste 3D-Rekonstruktion aus visuellem Datenmaterial

01.01.2013 -

Abgeschlossen
Max-Planck-Institut für Informatik & Robert Bosch GmbH

Name des Teilnehmers: Christian Kurz

Beschreibung des IT-Forschungsprojekts: Seit geraumer Zeit hat die Durchdringung des Endbenutzermarktes mit Geräten, die in der Lage sind, visuelle Daten zu erfassen, stetig zugenommen. Fotoapparate, Handys, Camcorder - es sind heute Milliarden Geräte, die es dem Menschen ermöglichen, zu beinahe jeder Zeit und in beinahe jeder Situation Bilder und Videos und neuerdings sogar Tiefenbilder aufzunehmen (zum Beispiel mit der Microsoft Kinect). Hätte der Endbenutzer die Möglichkeit, aus den Daten, die mit diesen Geräten aufgenommen wurden, auf einfache und robuste Art und Weise brauchbare 3D-Rekonstruktionen zu erzeugen, ergäbe sich eine Vielzahl neuer Anwendungsbereiche, beispielsweise dass der Anwender Bilder seines Hauses anfertigt, daraus ein 3D-Modell erzeugt und dieses bei Google Maps einfügt.

Der Massenmarkt stellt jedoch hohe Anforderungen an die Zuverlässigkeit. Die Ergebnisse automatischer Verfahren zur 3D-Rekonstruktion aus Bilddaten enthalten zumeist Löcher, Scherungen, Drift, Rauschen und geschätzte Parameter, die stark von den wahren Werten abweichen. Besonders von Menschenhand gefertigte Objekte erweisen sich zumeist als schwierige Fälle für Algorithmen, die dem Stand der Technik entsprechen. Die resultierenden Rekonstruktionen weisen für solche Objekte oft unverhältnismäßig viel Rauschen auf oder sind übermäßig geglättet. In diesen Fällen ist die Qualität nicht ausreichend für die angedachten Applikationen. Zurzeit gibt es keine intuitiven Werkzeuge, die es dem Endanwender mit nur geringen technischen Vorkenntnissen erlauben, diese Rekonstruktionen zu verbessern. Aufgrund dessen werden viele der eingangs skizzierten Anwendungen wohl nicht den Weg in den Massenmarkt finden.

Die Hauptidee dieses Forschungsvorhabens ist es nun, nicht nur auf diese herkömmlichen 2D-Korrespondenzen zurückzugreifen, sondern dem Endanwender auch die Möglichkeit zu geben, einfach Szenenmerkmale auf einer höheren Abstraktionsebene (High-level-Features) zu spezifizieren und in das Rekonstruktionsverfahren einzubringen, um dadurch die notwendigen Verbesserungen zu erzielen. Diese High-level-Features könnten unter anderem parallele Ebenen, Ebenen die aufeinander normal stehen, sich wiederholende Strukturen, hierarchische Beziehungen zwischen Objekten, die Tiefenordnung von Objekten, oder ähnliches sein. Die Planung sieht vor, diese High-level-Features über eine neuartige Benutzeroberfläche in den Prozess einzubringen, die es dem Anwender nur abverlangt, einfache Fragen zu beantworten. Eine derartige Benutzeroberfläche, die intuitiv und selbsterklärend ist, erfordert seitens der Anwender keine Vorkenntnisse.

Software Campus-Partner: Max-Planck-Institut für Informatik, Robert Bosch GmbH

Umsetzungszeitraum: 01.01.2013 - 24.02.2014