Histogram of oriented gradients

aus Wikipedia, der freien Enzyklopädie
Dies ist die aktuelle Version dieser Seite, zuletzt bearbeitet am 25. Juli 2020 um 20:07 Uhr durch imported>Aka(568) (Tippfehler entfernt).
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Links das Original und rechts das mit Scikit-image berechnete und visualisierte HOG

Das Histogram of oriented gradients (HOG) ist ein Hilfsmittel zur Merkmalsgewinnung in der Bildverarbeitung. Es wird insbesondere zur Detektion von Personen auf Fotos verwendet.[1] In einer Arbeit bei Udacity wurde im Jahr 2017 auch der Einsatz zur Erkennung von bewegten Kraftfahrzeugen in einem Video demonstriert.[2][3] Zur Objekterkennung ist immer ein Trainingsvorgang erforderlich. Die Größe des Trainingsdatensatzes hat einen Einfluss auf die Qualität der Objekterkennung. Bei HOG benötigt dieses Training deutlich weniger Beispiele und kann deutlich schneller als z. B. bei Haar-Wavelets durchgeführt werden.[4]

Der grundlegende Gedanke ist, dass Aussehen und Form von Objekten innerhalb eines Fotos auch ohne näheres Wissen über die Positionen von Kanten oder Ecken durch die Verteilung der lokalen Intensität oder der Anordnung der Kanten dargestellt werden kann. Daher wird das Bild in Teilbereiche zerlegt und für jeden Teilbereich werden die Orientierungen aller Kanten bestimmt und deren Anzahl als Histogramm gespeichert.

Eine weitere Anwendung ist, dass auf diese Weise die Ähnlichkeit zwischen verschiedenen Bildern bestimmt werden kann – ähnlich wie bei der Scale-invariant feature transform (SIFT).

Robert K. McConnell hat das grundsätzliche Verfahren bereits 1986 in einem Patent beschrieben,[5] bekannt wurde das Konzept und die Bezeichnung „Histogram of oriented gradients“ durch eine Veröffentlichung von Navneet Dalal and Bill Triggs im Jahr 2005,[1] welche zu diesem Zeitpunkt am Institut national de recherche en informatique et en automatique forschten.

Software

Mit Dlib erstellte Visualisierung eines trainierten HOG-Detectors zur Gesichtserkennung.

In freien Software-Bibliotheken zur Bildverarbeitung wie Scikit-image[6], OpenCV[7][8] und Dlib[9] sind Methoden zur Berechnung des HOG enthalten.

Literatur

  • Dalal, Navneet; Triggs, Bill. Histograms of oriented gradients for human detection. In: Computer Vision and Pattern Recognition, 2005. CVPR 2005. IEEE Computer Society Conference on. IEEE, 2005. S. 886–893. doi:10.1109/CVPR.2005.177

Einzelnachweise

  1. a b Navneet Dalal and Bill Triggs: Histograms of Oriented Gradients for Human Detection. Abgerufen am 5. Januar 2019 (englisch).
  2. Mithi: Vehicle Detection with HOG and Linear SVM. In: Towards Data Science. 28. März 2017, abgerufen am 5. Januar 2019 (englisch).
  3. Mithi Sevilla: A vehicle detection and tracking pipeline with OpenCV, histogram of oriented gradients (HOG), and support vector machines (SVM). In: GitHub. 25. Dezember 2018, abgerufen am 5. Januar 2019 (englisch).
  4. Davis King: Dlib 18.6 released: Make your own object detector! 3. Februar 2014, abgerufen am 7. Januar 2019 (englisch).
  5. Robert K. McConnell: Method of and apparatus for pattern recognition. In: Patent US4567610A. 22. Juli 1982 (englisch, google.com [abgerufen am 5. Januar 2019]).
  6. Histogram of Oriented Gradients. In: scikit-image – docs. Abgerufen am 5. Januar 2019 (englisch).
  7. HOGDescriptor Struct Reference. In: OpenCV. Abgerufen am 5. Januar 2019 (englisch).
  8. Histogram of Oriented Gradients. In: Learn OpenCV. Abgerufen am 5. Januar 2019 (englisch).
  9. Image Processing. In: dlib C++ Library. Abgerufen am 5. Januar 2019 (englisch).