Korrespondenzproblem (Bildverarbeitung)

aus Wikipedia, der freien Enzyklopädie

Das Korrespondenzproblem betrifft als Basis für die Berechnung des optischen Flusses (

optical flow

) und des Stereosehens (

stereo matching

) ein fundamentales Problem der Bildverarbeitung.[1] Dabei werden in zwei digitalen Bildern diejenigen Pixel gesucht, welche jeweils die Projektion desselben Elements derselben Szene darstellen. Das Ergebnis ist üblicherweise eine

disparity map

, worin für jeden Pixel des einen Bildes ein Verschiebungsvektor zum korrespondierenden Pixel des anderen Bildes ermittelt wird.

Algorithmen

Das Korrespondenzproblem wird üblicherweise mittels lokaler Filter oder globaler Algorithmen gelöst.

Lokale Filter

Bei den lokalen Filtern wird üblicherweise nur die lokale Umgebung eines Pixels betrachtet. Von Zabih und Woodfill wurden der Rank Filter und die Census-Transformation vorgeschlagen.

Anwendungen

Optischer Fluss

Das Korrespondenzproblem stellt sich auch bei der Berechnung des optischen Flusses, welches eine Abschätzung der Bewegungen von Gegenständen in einem Bild darstellt („

approximation to image motion defined as the projection of velocities of 3D surface points onto the image plane of a visual sensor

[2]).

Die kontinuierliche Ermittlung des optischen Flusses in optischen Abbildungen kann zur Verfolgung von bewegten Objekten und zur automatisierten Nachführung der entsprechenden Entfernungseinstellung eingesetzt werden.[3]

Stereokorrespondenz

Über die Stereokorrespondenz (

stereo matching

) können mit zwei Kameras Tiefenbilder in der Sichtrichtung bestimmt werden,[4] was eine Grundlage des vollautomatischen Fahrens darstellt oder für die rechnerische Reduktion der Schärfentiefe eingesetzt werden kann. Die Stereokorrespondez kann dabei auch mittels eines neuronalen Netzes bestimmt werden.[5]

Einzelnachweise

  1. Ramin Zabih, John Woodfill: Non-parametric local transforms for computing visual correspondence. In: Computer Vision — ECCV '94 (= Lecture Notes in Computer Science). Springer, Berlin, Heidelberg, 1994, ISBN 978-3-540-57957-1, S. 151–158, doi:10.1007/bfb0028345 (springer.com [abgerufen am 2. Oktober 2017]).
  2. Steven S. Beauchemin, John L. Barron: The computation of optical flow. ACM computing surveys (CSUR), 27. Jg., Nr. 3, 1995, S. 433–466, doi:10.1145/212094.212141.
  3. Advanced Depth From Defocus Autofocus - Lumix DC-GH5 - Technical Director Interview. YouTube-Video. Panasonic Newsroom vom 12. Juli 2017, abgerufen am 5. Oktober 2017.
  4. Daniel Scharstein, Richard Szeliski: A taxonomy and evaluation of dense two-frame stereo correspondence algorithms. In: International journal of computer vision, 47. Jg., Nr. 1–3, 2002, S. 7–42, doi:10.1023/A:1014573219977.
  5. Alex Kendall et al.: End-to-end learning of geometry and context for deep stereo regression. CoRR, vol. abs/1703.04309, 2017, doi:10.1109/ICCV.2017.17.