Loading AI tools
Algorithmus der Bildverarbeitung zur Kantendetektion Aus Wikipedia, der freien Enzyklopädie
Der Canny-Algorithmus (auch: Canny edge detector), benannt nach John Francis Canny[1], ist ein in der digitalen Bildverarbeitung weit verbreiteter, robuster Algorithmus zur Kantendetektion. Er gliedert sich in verschiedene Faltungsoperationen und liefert ein Bild, welches idealerweise nur noch die Kanten des Ausgangsbildes enthält.
Beim Canny-Algorithmus werden nur zwei Schwellenwerte für alle Bilder verwendet. Um eine bessere Kantenabbildung zu erhalten, wird der Kantendetektor auf jeden Block eines Bildes angewendet. Die Hauptkriterien für die Kantendetektion sind folgende:
Der Algorithmus besteht hauptsächlich aus fünf Schritten:
Daraufhin wird dann die Pixelstärke und Ausrichtung dieses Gradienten berechnet. Im nächsten Schritt werden alle Maxima gefunden, die das Bild enthält. Anschließend werden sie beibehalten und die anderen Nicht-Maxima entfernt. Der Prozess wird als nicht maximale Unterdrückung bezeichnet. In Schritt 4 wird das Pixel abhängig von den eingestellten hohen und niedrigen Schwellenwerten entweder als Kante oder als Nichtkante dargestellt. Wenn der Pixelwert zwischen dem hohen und dem niedrigen Schwellenwert liegt, ist dies eine schwache Kante. Um Kanten im Bild zu erkennen, werden zwei Schwellenwerte als hoch und niedrig betrachtet. Dann wird schließlich die Hystereseschwelle angewendet, die eine Entscheidung über die zu berücksichtigende oder verbleibende erkannte schwache Kante treffen kann. Das Pixel wird mit den benachbarten Pixeln verglichen. Wenn die schwache Kante mit dieser starken Kante verbunden ist, wird sie als Kante betrachtet, andernfalls wird sie aus der Kantenabbildung entfernt. Der Schwellenwert ist für alle Bilder gleich. Aus diesem Grund gibt es einige Einschränkungen, wenn es auf die Blockebene des Bildes angewendet wird. Der Algorithmus erkennt einerseits falsche Kanten im glatten Bereich und übersieht anderseits einige signifikante Kanten. Um die obige Einschränkung zu überwinden, werden ein adaptiver Schwellenwertblock und die Blockklassifizierungsblöcke zusammen mit den obigen Blöcken hinzugefügt. Und der Schwellenwert wird, basierend auf dem Block, unterschiedlich eingestellt. Somit wird die Leistung des Canny-Algorithmus auf Blockebene verbessert.[3]
Der Canny-Algorithmus arbeitet auf zweidimensionalen Intensitätswerten. Er kann also auf Grauwertbildern oder einzelnen Farbkanälen Kanten detektieren, enthält aber keine Vorschrift, wie mehrere monochrome Kanäle zusammengeführt würden. In der Regel werden Farbbilder vor einer Kantenerkennung in ein gemeinsames Grauwertbild überführt.
In Grauwertbildern sind Kanten durch große Helligkeitsschwankungen zwischen zwei benachbarten Pixeln charakterisiert. Sie können somit für ein Ausgangsbild als eine Unstetigkeit der Grauwertfunktion (nicht ableitbar) bzw. – in der üblichen diskretisierten Variante – als Sprungfunktion (ableitbar) aufgefasst werden. Canny ging beim Kantendetektorentwurf von einem Nutzsignal (Bild) aus, das mit weißem Rauschen überlagert ist.[1] Diese Annahme ist durchaus zweckdienlich, da thermisches Rauschen in Elektronikbausteinen, die bei der Bildaufnahme Verwendung finden, eine vergleichbare Verteilung aufweist. Es ist folglich nicht einwandfrei feststellbar, ob eine Kante aus dem eigentlichen Signal stammt oder durch das überlagernde Rauschen verursacht ist. Dem gaußverteilten weißen Rauschen setzt der Canny-Algorithmus daher eine auf der Glockenkurve basierende Glättungsfunktion entgegen, bspw. in Form einer Faltung mit einem Binomialfilter. In der Vorverarbeitung wird auf Bild damit ein Tiefpassfilter angewendet, sodass das vornehmlich im hohen Frequenzbereich vorkommende, weiße Rauschen gedämpft oder eliminiert wird, bevor Kanten gefunden werden. Ein neuer Grauwert eines Pixels ergibt sich dabei als Faltungsantwort aus den gewichteten Werten des eigenen und der ihn umgebenden Pixel. Ein Beispiel für eine solche Faltungsmatrix ist
Das heißt, die Faltungsmatrix ist separierbar. Die Vektoren, die dyadisch zur Matrix verknüpft werden, entsprechen hierbei der n-ten Zeile eines pascalschen Dreiecks.
Eine größere Faltungsmatrix verstärkt den Tiefpasseffekt und dadurch die Robustheit gegenüber Rauschen. Zugleich verschwinden jedoch feine Kanten.
Für den Canny-Algorithmus werden die partiellen Ableitungen der einzelnen Pixel in -Richtung und in -Richtung benötigt. Die partiellen Ableitungen bzw. werden ermittelt, indem das vorverarbeitete Bild mit Hilfe des Sobeloperators jeweils in - bzw. -Richtung gefaltet wird. Somit werden vertikale bzw. horizontale Kanten betont. Auch beim Sobel-Operator ergibt sich der neue Wert eines Pixels aus den gewichteten Werten der ihn umgebenden Pixel:
Nach jeweiliger Anwendung der beiden Sobeloperatoren auf das vorverarbeitete Bild ergeben sich zwei neue Bilder, die partiellen Ableitungen.
Es kann auch statt des Sobel-Operators und der Vorverarbeitung direkt mit den 1. Ableitungen (In x- und y-Richtung) des Gauß-Kerns gefiltert werden. Dies folgt aus der Assoziativität von linearen Filtern und daraus, dass die Ableitung sich als Filter darstellen lässt. So wird quasi in einem einzigen Durchlauf geglättet und abgeleitet. Canny hat gezeigt, dass dieser Ansatz den Signal-Rauschabstand optimiert.
Mittels der beiden ermittelten partiellen Ableitungen lässt sich die Richtung des Gradienten einer potentiellen Kante durch ein Pixel mittels
errechnen, wobei arctan2 der sog. „Arcustangens mit zwei Argumenten“ ist.
Da ein Pixel jedoch nur acht Nachbarn hat, werden die Kantenrichtungen gerundet auf 0°, 45°, 90° und 135°.
Im dritten Schritt wird ein Bild der absoluten Kantenstärken berechnet. Dabei wird der Wert eines einzelnen Pixels aus dem euklidischen Betrag der beiden partiellen Ableitungen gebildet.
In der Praxis wird zur Effizienzsteigerung oftmals eine Approximation verwendet:
Um sicherzustellen, dass eine Kante nicht mehr als ein Pixel breit ist, sollen im folgenden Schritt einzig die Maxima entlang einer Kante erhalten bleiben. Dafür wird vom Bild mit den absoluten Kantenstärken ausgegangen und für jedes Pixel die Werte mit den beiden Pixeln rechts und links neben der Kante (oder entlang des Gradienten) verglichen. Ist einer der Werte größer, wird der Grauwert auf Null gesetzt. Man kann sich das so vorstellen, dass der Algorithmus auf dem „Grat“ eines „Bergrückens“ entlangwandert und alle Bildpunkte zu Null setzt, die nicht zum Grat gehören. Diese Technik wird non-maximum suppression (NMS) genannt.
Abschließend wird noch festgestellt, ab welcher Kantenstärke ein Pixel zu einer Kante zu zählen ist. Um das Aufbrechen einer Kante durch Schwankungen in der errechneten Kantenstärke zu vermeiden, wird ein Hysterese genanntes Verfahren angewendet. Bei diesem Verfahren verwendet man zwei Schwellwerte . Man scannt das Bild durch, bis ein Pixel gefunden wird, dessen Stärke größer ist. Dieser Kante folgt man dann beidseitig. Alle Pixel entlang dieser Kante mit Stärke größer werden als Kantenelement markiert.
Nach diesem letzten Schritt ist der Algorithmus beendet und liefert eine Menge von Punkten, die bei geeigneter Wahl der Schwellwerte die im Ausgangsbild vorhandenen Kanten aufzeigen.[4]
Die durch den Algorithmus erhaltene Menge von Kantenpunkten kann auf viele verschiedene Arten verwendet werden, um weitere Informationen aus dem Bild zu extrahieren (z. B. Hough-Transformation zur Erkennung einfacher geometrischer Objekte oder Waltz-Algorithmus zur Erkennung von dreidimensionalen Objekten im Bild).
Der Algorithmus ist in den freien Bildverarbeitungsbibliotheken Scikit-image[5] und OpenCV[6] implementiert.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.