Klausur 2009, Fragen und Antworten PDF

Title Klausur 2009, Fragen und Antworten
Course Digitale Bildverarbeitung
Institution Duale Hochschule Baden-Württemberg
Pages 15
File Size 307.7 KB
File Type PDF
Total Downloads 271
Total Views 498

Summary

Klausurvorbereitung LausenDigitale BilderverarbeitungWomit beschäftige sich die DBV? DBV stellt Methoden und Techniken zur Verfügung, um natürliche Bilder zu transformieren (Neigung, Rotation, Skalierung), zu modifizieren oder zu kodieren (Kompression).Was ist das Ziel der DBV? - Bildverbesserung / ...


Description

Klausurvorbereitung Lausen Digitale Bilderverarbeitung Womit beschäftige sich die DBV? DBV stellt Methoden und Techniken zur Verfügung, um natürliche Bilder zu transformieren (Neigung, Rotation, Skalierung), zu modifizieren oder zu kodieren (Kompression). Was ist das Ziel der DBV? - Bildverbesserung / Bildtransformation - Mustererkennung / Bildinterpretation Woraus besteht ein DBV System? - Bilderfassung - Vorverarbeitung - Segmentierung - Merkmalsextraktion - Klassifikation

Farbwelten Was ist der Unterschied zwischen Adaptivem und Subtraktivem Farbsystem? Additive Farbmodell = RGB = Monitor Beim additiven Farbmodell wird die Farbe erzeugt, indem verschiedene Lichtquellen auf eine schwarze Oberfläche gestrahlt werden. Alle Farben addieren sich zu Weiß Subtraktive = CMYK = Drucker Beim subtraktiven Farbmodell ist die Grundfläche weiß und die Farben, die auf diese Fläche aufgestrahlt werden haben eine filternde Funktion. Bsp.: magenta wird aufgetragen, herausgefiltert wird grün Alle Farben addieren sich zu Schwarz Wo tritt er auf? Wenn man was ausdrucken will, das man aufm Monitor sieht. => Umrechnung von RGB nach CMYK Wie kann man diese Farbsysteme in einander umrechnen? RGB è฀ CMY RGB Farbanteile von 0 bis 255 in Prozentualanteile umrechnen C = 100% - Prozentualanteil( R ) M = 100% - Prozentualanteil( G ) Y = 100% - Prozentualanteil( B )

CMY C% M% Y% K%

è฀ CMYK -60% -60% -60% +60%

Alle Farbanteile gleichmäßig absenken und dafür zusätzlichen Schwarzanteil

Digitalisierung Physik des CCD erklären. der CCD-Chip besteht aus einem dünnen, dotierten Siliziumkristall, Licht wird vom Halbleiter absorbiert, es kommt zum Photoeffekt, dieser erzeugt ElektronenLoch-Paare, daraus resultierende Spannungsänderungen bewirken Transport der Elektronen 3 Chip Technologie vs. 1 Chip Technologie Welche Rauschanteile gibt es und wann dominieren sie? Rauschen: entsteht durch unerwünschte Elektronen Dunkelstromrauschen (CCD-Rauschen): Temperaturabhängig, Ladung direkt auf dem Chip Durch thermische Schwingungen im Silizium-Kristall Photonenrauschen: nnoise = WURZEL(nsignal) je größer Belichtungszeit, desto geringer der Rauschanteil (Wurzel) dominiert bei starkem Lichteinfall Ausleserauschen (CCD-Rauschen): Bei der Übertragung vom Pixel zum AD-Wandler treten Fehler auf (Bauartbedingt) Verstärkerrauschen: Rauschen wird auch verstärkt Dominiert bei wenig Licht und großer Verstärkung

Was ist die Bayermaske und warum existiert sie? Teilt die Pixel vom CCD in Farben auf. CCD kann keine Farben unterscheiden (Wellenlängen), deshalb jede Zelle Farbfiltern. Nur bei der 1 Chip Technologie.

Was ist der Moire Effekt?

Bei der Digitalisierung kann durch die Wahl einer zu geringen Abtastfrequenz Information verloren gehen. Der daraus entstehende Effekt nennt man Moire Effekt. Ziel der Digitalisierung ist, dass das menschliche Auge keine Graustufen im Bild erkennt. Eine Bildverfälschung, die auftritt, wenn beim Digitalisieren ein Gitter mit zu kleiner Gitterkonstante verwendet wird. o Wodurch kann man ihn bei der Aufnahme verhindern? Die Abtastfrequenz muss mindestens 2mal höher als die höchste Frequenz des Signals sein

Kompressionsverfahren Was heißt JPEG? Joint Photographic Experts Group o Zu welcher Sorte gehört JPEG? Hybride Kodierung o Welche Schritte werden bei der Kompression durchlaufen? 1. Bild / Input 2. Datenaufbereitung / Konstruktion 8 x 8 Subimages 3. Datenverarbeitung / DCT 4. Quantisierung (größter Verlust) 5. Entropiekodierung 6. komprimiertes Bild aus Wikipedia: 1. Farbumrechnung von meist RGB in den YUV-Farbraum 2. Tiefpassfilterung und Unterabtastung der Farbdifferenzsignale U und V (verlsutbehaftet) 3. Einteilung in 8x8 Blocks und DCT dieser Blocks 4. Quantisierung (verlustbehaftet) 5. Umsortierung (Zick-Zack förmig) 6. Entropiekodierung (Huffman-Kodierung) o Wo entstehen Verluste? Quantisierung Datenverarbeitung DCT o Welchen Charakter haben diese Verluste? Destruktiv (verlustbehaftet), Auge nimmt die Verluste nicht wahr

Vorverarbeitung Bildmodifikation, welche den Informationsgehalt nicht bedeutend ändert • Beleuchtungskorrekturen • Rauschreduzierung • Kontrasterhöhung • Größenanpassung Punktoperationen zur Bildverbesserung. Operationen auf einen Punkt bezogen Homogene (nicht Ortsabhängig vom Pixel) und Inhomogene Transformation der einzelnen Bildpunkte, ohne Berücksichtigung der benachbarten Bildpunkte. Anwenndungen sind Grauwerttransformationen. • Histogramm-Ausgleich: Helligkeitsverteilung auf die komplette Skala. Anzahl der Pixel pro Grauwert wird ausgeglichen • Lineare Transformationen zur Helligkeits- und Kontrastanpassung • homogene PO > LUT (Lookuptabelle) homogen = vom der Position des Pixels unabhängig • inhomogene PO(z.B. Shadingkorrektur) Shading entsteht durch Beleuchtungsunterschiede oder durch Inhomogenität bei der Erfassung. Shadingkorrektur: Bildmatrix mit der Shadingmatrix verknüpfen. Shadingmatrix generiert man durch ein Weiß- und ein Schwarzbild. • bildet Grauwerte auf sich selbst ab Lookup-Tabellen • bei homogenen Punktoperationen • nimmt Berechnungen voraus • enthält alle möglichen Ergebnisse einer Punktoperation • äquivalent zur Punktoperation

Nachbarschaftsoperatoren Was sind LSI Filter Linear Shifting Invariant - lineare verschiebungsinvariante Filter LSI filter sind filter bei dem benachbarte pixel durch faltung kombiniert werden o warum werden Sie verwendet? Kantendetektion, also Kantenerkennung (Laplace Operator) Glättung (Laplacian of Gaussian / LoG) Zum Auffinden wichtiger Frequenzen o Was unterscheidet Globale inhomogene Filter von LSI Filtern? Zu welcher Gruppe von Filtern gehört der Median-Filter? Der Median-Filter ist ein Filter der Rangordnungsfilter, die wiederum den nichtlinearen Filtern zugeordnet sind. Nichtlineare Filter sind Filter, die nicht durch eine Faltung beschrieben werden können. o Wie funktioniert er? Es werden die Grauwerte der Pixel innerhalb einer definierten Umgebung eines Pixels im Zentrum dieser Umgebung nach ihrere Größe sortiert, wobei der Wert des zu ersetzenden Pixels mit einfließt. Der mittlere Wert der sortierten Liste wird zurückgegeben und der Wert des zentralen Pixels wird durch ihn ersetzt. Medianfilter haben der Vorteil, einzelnen Pixel zu ersetzen ohne das eine Kantenglättung vorgenommen wird. Medianfilter eliminieren „Ausreißer“ eines Signals / Bildes Die Ausreißerpixel werden auch Salt and Pepper genannt. o Anwenden! Auf welchen Bildern arbeiten Morphologische Filter? Binärbilder; sie verändern die Form von Objekten o Welche Operationen gibt es? Erosion (kleine Effekte werden durch eine Maske entfernt) Dilatation (füllt Lücken in Objekten oder zwischen Objekten auf) ! morphologische Operatoren sind nicht kommutativ, d.h. die Reihenfolge der Abarteiung spielt eine Rolle o Erklären Sie Opening Zuerst Erosion, dann Dilatation Dient dem Entfernen von Störungen einzelner Bildpunkte, kleiner Strukturen oder Auswüchsen Glättet äußere Ecken, entfernt dünne Brücken, kleien außenliegende Gebiete

o Erklären Sie Closing. Zuerst Dilatation, dann Erosion Kleinere Lücken werden geschlossen Glättet innere Ecken, überbrückt kleine Distanzen, entfernt kleine innnenliegende Brücken §฀

Anwenden!

o Was ist ein Hit-Miss-Operator? Mittels einem Hit-Miss-Operator können spezifische Formen in einem Bild gefunden werden. Wie beim Opening, Closing sind zwei Operatoren notwendig. Vorgehensweise: - Festlegen der spezifischen Form - Erosion des Bilds mit der spezifischen Form o Ergebnis: alle Objekte die kleiner als die spezifische Form ist werden eliminiert o Allerdings bleiben alle Objekte erhalten, die größer als die Maske sind - 2. Operation: Mit einer zweiten Maske wird der Hintergrund erodiert, mit der Ausnahme der Hintergrundpixel die das Objekt umgeben - Durch die Schnittmenge der beiden Operatoren erhalten wir die Hit-MissMaske für die spezifische Form Mittels einem Hit-Miss-Operator können auch isolierte Pixel entfernt bzw. Ecken gefunden werden. Wie funktioniert ein Skelettierungs Algorithmus? - Verdünnung von Segmenten auf eine Skelettlinie - Skelettlinie soll die ursprüngliche Form des Segments wiederspiegeln - Eigenschaften: o Genau 1Pixel breit o Genau in der Mitte eines lokalen Segments o Wiederspiegelung der Ursprungsform o Robustheit gegen Störungen Algorithmus: Algorithmus muss unempfindlich gegen kleine Störungen am Segmentrand sein, damit keine Verästelungen des Skeletts entstehen. Außerdem muss er terminieren, d.h. nach einer bestimmten Anzahl von Iterationen dürfen keine weiteren Änderungen am Skelett auftreten. -

prüfe jedes Pixel

-

-

entferne Pixel, falls die Eulersche Charakteristik (Flächen, die unter topologischen Gesichtspunkten als gleich angesehen werden haben die selbe Euler-Charakteristik) der 3x3 Nachbarschaft nach Entfernung unverändert bleibt o Sonderpunkt: Endpunkte von Linien nicht entfernen Wiederholte Prozedur bis kein Pixel mehr entfernt werden kann

Beschleunigung: - Unterteilung des Bildes in Teilbilder - Wahl der Pixelreihenfolge Konturverfolgunsverfahren: Es werden nur Bildpunkte überprüft die am Rand eines Segments gehören. Dazu müssen vorher allerdings Segemente gefunden und extraheirt werden.

Segmentierung = Zusammenfassen von Punkten zu Bereichen = Unterteilung des Bildes in Bereiche Wie funktioniert die Wasserscheidentransformation? Ein Verfahren zur Segmentierung innerhalb der Bildverarbeitung. o Geben Sie den Ablauf wieder. §฀ Grauwertunterschiede eines Bildes werden als Höhenrelief interpretiert §฀ Bei Flutung des „Grauwertgebirges“ entstehen in den Becken Wasserscheiden §฀ Flutung wird auf dem Gradientbild vorgenommen, d.h. die Wasserscheiden sollen sich später entlang starker Kanten errichten Die Idee der Wasserscheidentransformation ist recht einfach: Ein Grauwertbild wird als topographisches Relief interpretiert und jeder Punkt dieses digitalen Bildes einem regionalen Minimum zugewiesen. Dazu wird ein Flutungsprozess simuliert, bei dem Wasser aus den regionalen Minima strömt und damit die Becken (Minima) füllt. Punkte werden einem Minimum zugeordnet, indem sie mit der entsprechenden Staubeckennummer markiert werden. Es werden durch den steigenden Wasserstand Einflusszonen der Minima berechnet. Treffen zwei Becken aufeinander, werden die Punkte an den Berührungsstellen speziell als Dämme markiert. Diese Dämme sind die Wasserscheidenlinien, die mögliche Objektgrenzen darstellen. o Welche Probleme können auftreten? Die Anwendung der Wasserscheidentransformation resultiert oft in starker Übersegmentierung (vor allem bei verrauschten Bildern) Zu wenige Wasserscheiden. à฀ Untersegmentierung o Wie gehen sie danach vor? Diese kann durch Vorverarbeitungsmaßnahmen (welche) gemindert werden. Um die Übersegmentierung nachträglich zu reduzieren, können die Regionen nach bestimmten Kriterien verschmolzen werden. Manuell Wasserscheiden hinzufügen.

Was wird bei der Signalseparation nach Otsu gemacht? Histogramm aufteilen in Vorder- und Hintergrundbereich Mit dem Verfahren von Otsu kann explizit der Schwellwert berechnet werden. - man definiert zwei Klassen von Grauwerten - Varianz (mittlere Abweichung) der Klassen innerhalb minimieren, zwischen den Klassen maximieren - Unterteilung des Bildes in Vordergrund und Hintergrund o Geht das auf allen Bildern? Nö. Ich würd mal sagen, wenn ein Vordergrundobjekt neben Vordergrund-Grauwerten auch Hintergrund-Grauwerte besitzt, dann geht’s net. (Vermutung) Bei verrauschten Bildern geht’s sicher net

Welche Voraussetzungen muß das Bild erfüllen für eine gute Separation von Objekt und Hintergrund? Histogramm mit 2 Maxima für Vorder- und Hintergrundbereich. Demnach unterschiedliche Grauwerte zwischen Vorder- und Hintergrundobjekten. (entsprechend der Vermutung von eben)

Merkmalsextraktion Gewinnung von Informationen aus Bildern die eine direkte Klassifizeirung erlaubt. Welche Merkmale kennen Sie? • Kontur • Farbe • Kompaktheit: Verhältnis von Umfang^2 zur Fläche • Schwerpunkt: Kann zur Berechnung abhängiger Größen verwendet werden (z.B. Trägheit) • Formfaktoren; Exzentrizität: Verhältnis der Hauptachsen zueinander bildet die maximale Exzentrizität • Einen Kasten über das Symbol legen • Statistiken 1. Ordnung: Mittelwert, Varianz, Schiefe, Exzess/Wölbung/Kurkorsion, Energie, Entropie • Statistiken 2. Ordnung: Korrelation, Kovarianz, Trägheitsmoment, Energie, Entropie Wie bekommt man diese aus dem Bild? - Bilden von Clusterzentren, danach euklidische Distanz Euklidische Distanz =für die einheitliche Einteilung der Abstände von Punkten - Iterative Methode zum bestimmen von Zentren (mehrfache Neuberechnung von Zentren) bis keine weiteren Änderungen zwischen den Stufen vorkommt. - Mit heuristischen Verfahren lassen sich leicht sehr viele Merkmale erzeugen Heuristische Verfahren basieren auf Intuition, Einsicht, Nachdenken und Experimentieren bzw. daraus gewonnene Information

Was ist ein Merkmalsvektorraum? 2 Typen zur Klassifizierung von Objekten - Objektbasierte Klassifizierung (einfach, wenn Objekt gut vom Hintergrund zu unterscheiden ist und sich nicht überlappen bzw. berühren) Merkmale werden dann für das gesamt Objekt definiert und nicht nur für einzelne Pixel - Pixelbasierte Klassifizierung Eine Gruppe von p Eigenschaften bildet einen p-dimensionalen Raum. Pro Dimension wird eine Eigenschaft abgebildet. Jedes Objekt, oder jeder Bildpunkt kann als Vektor im Merkmalsvektorraum dargestellt werden.

o Was sind gute Merkmale? AIBO hat rosa Ball – gutes Merkmal, Wenn aber alle Anderen ein rosa Trikot haben, ist das Merkmal scheiße o Wie kann ich schlechte Merkmale eleminieren?

Bildanalyse Wie findet man bei der Klassifikation im Merkmalsraum einen Cluster? Gruppe von Merkmalsvektoren bilden im Merkmalsraum einen Cluster. Objekte mit ähnlichen Merkmalen bilden einem Cluster. Die Objekte die mit einer bestimmten Wahrscheinlichkeit übereinstimmten bilden einen Cluster. Mehrere Merkmalsvektoren, die von der selben Testperson stammen, bilden typischerweise eine Punktwolke in einem begrenzten Gebiet dieses Raumes. Sie bilden einen sogenannten Cluster. Beispiel: Erbsen Wie ordne ich Merkmalsvektoren den Clustern zu?

Was sind Neuronale Netze? Künstliche neuronale Netze bestehen aus einer großen Anzahl kleiner Elemente, den Neuronen. Information wird verarbeitet, indem sich die Neuronen mit Hilfe von gerichteten Verbindungen untereinander aktivieren (analage den Vorgängen im Gehirn) Neuronale Netze zeichnen sich durch ihre Lernfähifkeit aus. Sie können eine Aufgabe anhand von Trainisngaufgaben erlernen, ohne explizit dafür programmeirt zu werden. Weitere Vorteile sind die hohe Parallelität bei der Informationsverarbeitung, die hohe Fehlertoleranz und die verteilte Wissensrepräsentation, wodurch ein Ausfall eines Neutrons nur ein kleiner Wissensausfall bedeutet. Das richtige Trainieren eines neuronalen Netzes ist Voraussetzung für seinen möglichen Lernerfolg. Neuronale Netze berechnen über ihre Eingangssignale und ihren inneren Zustand die Ausgangssignale. Neuronale Netze sind lernfähig, dazu wird eine Lernregel benötigt. Durch diese Lernregel werden die Gewichte der einzelnen Verbindungen verändert, um so ein gewünschtes Ausgangssignal zu erreichen. Die Eingangssignale werden mit Gewichtungsfaktoren während der Lernphase bewertet und weitergeleitet. Die Gewichtungsfaktoren werden auch als Synapsengewichte bezeichnet. o Wie kann man Sie einsetzen? Zur Mustererkennung, Sprachanalyse und anpassungsfähiger Software wie virtuelle Agenten und KI-Robotern in Spielen o Was ist ein Perzeptron? Das Perceptron ist ein vereinfachtes Neuronenmodell. Es wird zwischen einlagigen und mehrlagigen Perzeptrons unterschieden. Die prinzipielle Arbeitsweise besteht darin, einen Eingabevektor in einen

Ausgabevektor umzuwandeln. Es bestehen nur Verbindungen vom Input zum Output, aber nicht umgekehrt. Sowohl Input als auch Output können nur die Werte 0 und 1 annehmen. Die Inputschicht ist vollständig mit der Outputschicht verbunden. Die Gewichte dieser Verbindungen werden beim Lernen modifiziert. Lernen findet in diesem Modell durch Änderungen der Kantengewichte mit Hilfe eines Algorithmus statt, der bei lösbaren Aufgaben immer eine Lösung findet. Für die Sinneswahrnehmung wird wie beim Auge des Menschen eine Rasterisierung genommen. Die Aktivität eines Ausgangssignal berechnet sich auf Grund der Aktivität des Sendesignals sowie der Verbindungsstärke zwischen sendendem und empfangem Element. Der über den Eingägnen aufsummierte Wert wird danach einer Schwellwertprüfung unterzogen. Wird dieser Wert überschritten ist das Ausgangssignal 1, ansonsten 0.

Einlagiges Perzeptron Es gibt nur eine Neuronenschicht, die auch den Ausgabevektor repräsentiert. Das einfachste Perzeptron mit zwei Eingabewerten und einem einzigen Ausgabeneuron kann z.B. zur Darstellung einfacher logischer Operatoren wie AND und OR genutzt werden. Mehrlagiges Perzeptron Neben der Ausgabeschicht gibt es mind. eine weitere verdeckte Schicht. o Was ist der Vorteil von Überwachtem Lernen? Das der Klassifikation einer Trainingsphase anhand von neuronalen Netzen voraus geht. o Erklären Sie übersichtartig den Lernalgorithmus. !!! Lernen wird von der Art des Fehlers des Output-Elements abhängig gemacht !!! Bei jedem Lernschritt wird der gewünschte Output mitgegeben und mit dem tatsächlichem verglichen. Unterschied = Fehler Mittels Gewichtkorrektur zwischen den betroffenen Verbindungen zwischen Input und Output, und somit das Verändern des Schwellwertes, kann der Fehler eliminiert werden Zum Testen des Netzwerkes werden dem System Input-Masken angeboten und jeweils ein Simulationsschritt vorgenommen. Der Gesamtfehler aller Muster wird berechnet, indem man die Fehler aller Output-Elemente bei allen Mustern aufsummiert. Je kleiner dieser Wert

ist, umso besser hat das Netzwerk gelernt....


Similar Free PDFs