Zusammenfassung Digi- tale Bildverarbeitung

Digitale Bildverarbeitung, Prof. Dr. Gitta Domik, Zusammenfassung v. Florian Schoppmann 

Das Copyright für die dieser Zusammenfassung zugrunde liegenden Vorlesungsunterlagen (Skripte, Folien, etc.) liegt beim Dozenten. 

Darüber hinaus bin ich, Florian Schoppmann, alleiniger Autor dieses Dokuments und der genannte Dozent ist in keiner Weise verantwortlich. 

Etwaige Inkorrektheiten sind mit sehr großer Wahrscheinlichkeit erst durch meine Zusammenfassung/Interpretation entstanden. 

Zusammenfassung Digitale 

Bildverarbeitung 

1. Einführung 

Geschichtliches: 

Ab den 1920ern: Bartlane Cable Picture Transmission 

mit ca. 5 Graustufen, Übertragung eines Bildes 

von New York nach London in ausreichender 

Druckqualität in 3 Stunden 

(Erst) ab den 1960ern: Wissenschaftliche Disziplin 

durch Weltraumprogramm 

Anwendungen: Medizin (Röntgenbilder), Fotografie 

(Störungen entfernen), Vermessung der Erde, 

etc. 

Schritte bei der Bildverarbeitung: 

Image Acquisition Bilderfassung mit Sensor. Aktiv 

(Messung der Reflektionen ausgestrahlter Wellen) 

oder passiv (ausschließlich Messung von 

Wellen von Objekten des Sichtbereichs) 

Image Enhancement 

Image Restauration 

Color Image Processing 

Wavelets and Multiresolution Processing 

Compression 

Morphological Processing 

Segmentation Einteilen des Bildes in überlappende 

oder nicht-überlappende Teile 

Representation & Description Segmente und Bilder 

werden weiter manipuliert, um den Inhalt 

der Bilder so zu charakterisieren, dass Erkennung 

und Interpretation unterstützt werden 

Object Recognition Der eigentlich Seh-Teil der 

Verarbeitung. Herstellung semantischer Informationen. 

Wellenlängen des Lichtes: 

400 - 420 nm Violett 575 - 585 nm Gelb 

420 - 490 nm Blau 585 - 650 nm Orange 

490 - 575 nm Grün 650 - 750 nm Rot 

Farbmodelle: RGB, CMY(K), HIS (Hue- 

Intensity-Saturation, als Zylinder), HLS (Hue- 

Luminance-Saturation, als Doppelkegel), HSV 

(Hue-Saturation-Value, als Kegel) 

Menschlicher 

Sehsinn: 

Zäpfchen: Teil 

des menschlichen 

Auges zur Wahrnehmung 

von 

Farbe 

Stäbchen: Wahrnehmung 

von 

Helligkeit 

Mach-Band-Effekt: 

Sinnesphänomen; 

an Grenze zwischen 

heller und dunklen Fläche erscheint auf 

heller Seite ein schmales Band, welches noch heller 

ist. Entsprechend auf der dunklen Seite. 

2. Rasterung und Quantisierung 

Darstellung eines Bildes als 2-stellige Funktion f : 

M × N −→]0, ∞[, wobei M := {1, . . . , m}, N resp. 

Aufteilung in Beleuchtungs- und Reflektionskompontenten 

I : M×N −→]0, ∞[, J : M×N −→]0, 1[. 

Es gelte dabei f = I · J. 

I gibt den Grauwert eines Pixels an. 

Aliasing: Allgemeine Definition: Alias-Effekte sind 

durch die Verletzung des Abtasttheorems (siehe 

nachfolgenden Absatz) auftretende Fehler beim 

Abtasten von Signalen. 

Auswirkungen bei der Bildverarbeitung: Moiré- 

Muster, Treppeneffekte an harten Kanten, Verschwinden 

von Strukturen, die dünner als 1 Pixel 

sind, etc. 

(Nyquist-Shannon’sches) Abtasttheorem: Ein kontinuierliches 

Signal mit einer Maximalfrequenz 

fmax muss mit einer Frequenz größer als 2 · fmax 

abgetastet werden, damit man aus dem so erhaltenen 

zeitdiskreten Signal das Ursprungssignal ohne 

Informationsverlust wieder rekonstruieren kann. 

Anti-Aliasing: Entweder feinere Auflösung bei Rasterung 

wählen: Jede Struktur durch mindestens 2 

Bildpunkte repräsentieren oder durch Verwischung 

das Auge täuschen 

Ortsbereich: Bildpunkte ↔ Frequenzbereich: enthaltenen 

Frequenzen 

(Umwandlung mittels Spektralanalyse) 

1





3. Fourier Transformation 

Transformationen werden oftmals dazu eingesetzt, 

Probleme zu vereinfachen – indem etwa die Komplexität 

der zur Problemlösung verwendeten Algorithmen 

gesenkt wird. Beispiel: Multiplikation/Division 

mittels Logarithmentafeln. Transformation 

des Problems f(a, b) = a · b auf eine Addition 

(+ Hin- und Rücltransformation): exp(ln(a) + 

ln(b)). 

Aus der Analysis ist bekannt, dass eine über 

] − ∞, ∞[ stückweise stetige, stückweise monotone 

sowie T -periodische Funktion f : −→ als Summe 

von Sinus und Cosinus-Funktionen dargestellt 

werden kann: 

f(x) = a0 

2 + 

∞ 

k=1 

ak cos( 2π 

T kx) + bn sin( 2π 

T kx) 

(1) 

Durch Umformen und Ausnutzen von Additionstheoremen 

erhält man, dass sich f auch in komplexer 

Form schreiben lässt: 

f(x) = 

ck = 1 

T 

∞ 

k=−∞ 

T/2 

ck exp(i 2π 

kx), mit (2) 

T 

−T/2 

f(t) exp(−i 2π 

kt)dt ∈ (3) 

T 

Definiere nun die sogenannte Fourier-Transformation 

(FT) F{f(x)}, sofern sie für ganz existiert. 

Im Folgenden setzen wir immer limx→±∞ = 0 voraus, 

da dies hinreichend für die Existenz ist – allerdings 

nicht unbedingt notwendig). 

F (u) := 

∞ 

−∞ 

f(t) exp(−i2πut)dt (4) 

Zur Verallgemeinerung auf den Fall, dass f nichtperiodisch 

ist, gehe T → ∞. Damit folgt: 

T · ck = F ( k 

) (5) 

T 

Erweitere nun (2) mit T/T : 

2 

f(x) = 

∞ 

k=−∞ 

T ck exp(i 2π 1 

kx) 

T T 

(6) 

Da 1 

T 

für T → ∞ infinitesimal klein wird, ersetze 

im Folgenden: 

1 

T 

→ du, k 

T 

Erhalte durch T → ∞: 

f(x) = 

∞ 

−∞ 

k 

→ u, F ( ) → F (u) (7) 

T 

F (u) exp(i2πux)du (8) 

Folglich lässt sich jede beliebige über ] − ∞, ∞[ 

stückweise stetige, stückweise monotone Funktion 

f, deren FT wie oben beschrieben exitsiert, 

als unendliche Summe bzgl. der Basis B := 

{exp(−i2πux) | u ∈ } darstellen. Dass B 

tatsächlich Basis ist, folgt aus der Orthogonalität 

zweier Elemente exp(−i2πu1x) und exp(−i2πu2x) 

für u1 = u2 bzgl. des Skalarprodukts fg auf 

der Menge aller komplexwertigen Funktionen, d. h. 

f, g : → . 

Bemerkungen: i) Die Def. von F in (4) ist also 

nichts anderes als das Skalarprodukt zwischen der 

Funktion f und dem entsprechenden Basisvektor 

u → exp(−i2πut). (Vgl. den Anschauungsraum, in 

dem wir beim Basiswechsel für die Koordinatenbestimmung 

ebenfalls das Skalarprodukt eines Vektors 

mit den neuen Basisvektoren bilden würden.) 

ii) Das u in der Definition von F wird Frequenzvariable 

genannt. 

Da F im Allgemeinen eine komplexe Funktion ist, 

teilt man auf: F (u) = R(u) + iI(u) 

Als Polarform von F ergibt sich: 

F (u) = |F (u)| exp(i · Φ(u)), mit (9) 

|F | = R2 + I2 −1 I 

, Φ = tan 

R 

|F (u)| heißt Fourier-Spektrum, |F (u)| 2 

Leistungsspektrum von f und Φ(u) der Phasenwinkel. 

Eigenschaften der Fourier-Transformation: 

Linearität: 

F{af(x) + bg(x)} = aF (u) + bG(u) (10) 

Änderung der Skalierung im Ortsbereich: 

F{f(ax)} = 1 

F (u ) (11) 

a a





Verschiebung im Ortsbereich ändert nur die 

Phase: 

Ableitung: 

F{f(x − a)} = F (u) exp(i2πua) (12) 

F{ dn 

dx n f(x)} = (i2πu)n F (u) (13) 

Integral des Leistungsspektrums: 

∞ 

−∞ 

|f(x)| 2 dx = 

∞ 

−∞ 

Symmetrieeigenschaften: 

f reell =⇒ F (−x) = F (x) 

f imaginär =⇒ F (−x) = −F (x) 

f gerade, d. h. f(−x) = f(x) 

=⇒ F (−x) = F (x) 

f ungerade, d. h. f(−x) = −f(x) 

=⇒ F (−x) = −F (x) 

Für den zweidimensionalen Fall: 

|F (u)| 2 du (14) 

F{f(u, v)} = F (u, v) (15) 

= 

= 

∞ ∞ 

−∞ 

∞ 

−∞ 

−∞ 

f(s, t) exp(−i2π(us + vt))dsdt 

∞ 

f(s, t) exp(−i2πus)ds · 

−∞ 

exp(−i2πvt))dt 

(Separabilität von F ) 

(16) 

(17) 

gelten die gleichen Eigenschaften wie im eindimensionalen. 

Zustätzlich: Wird f(x, y) um den Winkel 

θ gedreht, so auch F{f(x, y)} = F (u, v). 

Für die praktische Anwendbarkeit benötigen wir 

die diskrete Fourier-Transformation (DFT). Eine 

kontinuierliche Funktion f(x) mit FT F (u) werde 

dazu diskretisiert, d. h. auf N äquidistanten Intervallen 

[0, ∆x] = [x0, x1], . . . , [xN−1, xN] approximiert 

durch die Treppenfunktion g(x) mit FT 

G(u). (OBdA setzen wir hier voraus, dass x0 = 

0, ggf. wäre ansonsten noch eine Verschiebung 

notwendig.) Der Kehrwert von ∆x ist dabei die 

(Abtast-)frequenz. 

g(x) := 

 

f(xi) wenn x ∈ [xi, xi+1[ 

0 sonst 

(18) 

Nach Nyquist’schem Abstasttheorem ist die höchste 

darstellbare Frequenz bei einer Abtastrate von 

1 

∆ (also einem Abtastinterval von ∆) gerade ν∆ := 

1 

2∆ . 

Folglich betrachten wir nur Frequenzen innerhalb 

des Intervals [−ν∆x, +ν∆x] mit äquidistanter Zerlegung 

(also mit Abstand ∆u = 2ν∆x 1 

N = N∆x ): 

u0 < · · · < uN. 

Es kann nun approximiert werden: 

F (un) = 

∞ 

−∞ 

≈ G(un) = ∆x 

= ∆x 

N−1 

k=0 

f(t) exp(−i2πunt)dt 

N−1 

k=0 

g(k∆x) exp(−i2πunk∆x) 

g(k∆x) exp(−i2πk( n 

N 

da un∆x = (− 1 

2∆x 

− 1 

2 )) 

+ n 

)∆x 

N∆x 

(19) 

Da die Abbildung n → G(un) (bei entsprechender 

Fortsetzung der un) N-periodisch ist, wird aus 

praktischen Gründen die DFT H von g(x) jedoch 

zwischen 0 und ν∆x als n-elementige Folge definiert. 

Zudem wird ∆x = 1 gewählt. (Bei einer beliebigen 

Funktion würden wir die DFT auf einer Skalierung 

vornehmen, welche die Abtastpunkte auf 

einen Abstand von 1 abbildet.) Zusammen mit etwas 

geänderter Skalierung ( 1 

N steht nun bei der 

Hintransformation) und gn := g(n∆x) = g(n) folgt: 

Gn := 1 

N−1 

gk exp(−i2πk 

N 

n 

) (20) 

N 

 

N−1 

gn = 

k=0 

k=0 

Gk exp(i2πk n 

) (21) 

N 

Bemerkungen: Einsetzen von (21) in (20) ergibt 

Gn 

= 1 

N 

N−1 

k=0 

= 1 

N−1 

N 

N−1 

l=0 

N−1 

Gl exp(i2πl k 

n 

) exp(−i2πk 

N N ) 

exp(i2π(l − n) k 

N ) 

Gl 

l=0 k=0 

 

N wenn l = n, 

sonst 0 wg. (23) 

 

= Gn 

(22) 

Man sieht also, dass das Produkt der konstanten 

Vorfaktoren 1 

N ergeben muss. Die Aufteilung ist 

prinzipiell willkürlich möglich. 

3





Sei w := exp(i2π(l − n) 1 ). Es gilt: w ist N-te Ein- 

N 

heitswurzel (Gruppeneigenschaft), und exp(i2π(l − 

n) k 

N ) = wk , da k ∈ . Folglich: 

N−1 

k=0 

w k = wN − 1 

w − 1 

= 0 (23) 

Die Erweiterung auf den 2-dimensionalen Fall erfolgt 

analog zur kontinuierlichen FT. Es gelten die 

für die kontinuierliche FT oben genannten Eigenschaften. 

Durchschnitt f einer 2-dimensionalen diskreten 

Funktion f(x, y): 

f(x, y) = 1 

MN 

M−1 

x=0 

N−1 

y=0 

f(x, y) 

= F (0, 0) (durch Einsetzen) 

(24) 

Die Faltung zweier Funktionen f, g ist definiert im 

Eindimsionalen (25) und 2-Dimensionalen (26): 

(f ∗ g)(x) = 

(f ∗ g)(x, y) = 

∞ 

−∞ 

∞ ∞ 

−∞ 

f(t)g(x − t)dt (25) 

−∞ 

f(s, t)(x − s, y − t)dsdt 

Faltungstheorem (Convolution Theorem): 

(26) 

F{(f ∗ g)(x)} = F (u) · G(u) (27) 

F{f(x) · g(x)} = (F ∗ G)(u) (28) 

Faltung im diskreten Fall, f, g : → , beide Nperiodisch 

(2-dimensionaler Fall analog): 

(f ∗ g)(x) = 

N−1 

i=0 

f(i)g(x − i) (29) 

Der Dirac-Impuls δ(x − a) eine Distribution, die 

über ihr Integral definiert ist. Für eine beliebige 

Funktion f(x) muss gelten: 

∞ 

−∞ 

∞ 

−∞ 

f(x)δ(x − a)dx = f(a) (30) 

a+t 

δ(x − a)dx = lim 

t→0 

Im 2-Dimensionalen analog. 

4 

a−t 

δ(x − a)dx = 1 

(31) 

Die Fast Fourier-Transformation (FFT). Im Folgenden 

sei WN = exp(−i2π/N) primitive N-te 

Einheitswurzel. N sei der Form N = 2 m = 2M, 

m, M ∈ . Nach (20) folgt ((fn) sei Folge von 

Funktionswerten im Orts- (Fn) im Frequenzbereich): 

 

Fn = 1 

2M−1 

fkW 

2M 

k=0 

nk 

2M 

= 1 

M−1 

1 

2 M 

k=0 

+ 1 

M−1 

M 

= 1 

1 

2 M 

k=0 

M−1 

f2kW n(2k) 

2M 

f2k+1W n(2k+1) 

2M 

f2kW nk 

M 

 

k=0 

 

=:F 

 

(even) 

n 

+ 1 

M 

M−1 

f2k+1W nk 

M W n 2M 

 

k=0 

 

=:F 

 

(odd) 

n 

(da W n2k 

2M = W nk 

M ) 

 

(32) 

(33) 

= 1 (even) 

(F n + F 

2 (odd) 

n W n 2M) (34) 

Das Divide & Conquer-Prinzip werde entsprechend 

fortgeführt... Laufzeitverbesserung von N 2 (mit 

” normalem“ naivem Ansatz) auf N log 2 N. 

4. Punktoperationen 

Punktoperationen verändern die Pixel unabhängig 

von den Nachbarpixeln: Operation T auf einen Pixel 

an Position (x, y) und altem Grauwert r. Neuer 

Grauwert s = T (g, x, y), falls nur von Grauwert 

abhängig (oft), dann s = T (r). 

(Nachbarschaftsoperationen – siehe nächstes Kapitel 

– berücksichtigen umliegende Pixel.) 

Beispiele für Punktoperationen: 

Negativ 

Exponential-Transformation ( ” Gamma Korrektur“): 

T (r) = cr γ oder T (r) = c(r + ɛ) γ 

Operationen über mehrere Bilder: Bspw. 

Durchschnittbildung 

Maße für Qualität eines Bildes:





Mittlerer Grauwert 

Γ := 1 

MN 

M−1 

x=0 

N−1 

y=0 

f(x, y) (35) 

Varianz Mittlere quadratische Abweichung: 

Λ := 1 

MN 

M−1 

x=0 

N−1 

(f(x, y) − Γ) 2 

y=0 

(36) 

Histogramm Bildet einen Grauwert g auf die Anzahl 

Pixel mit diesem Grauwert r ab: r → 

|{(x, y) | f(x, y) = r}|. Wenn normiert (also 

durch MN geteilt), entspricht das Histogramm 

einer Wahrscheinlichkeitsverteilung 

über den Grauwert eines zufällig gewählten Pixels. 

Grauwertpofil Grauwerte entlang einer Linie, d. h. 

Zuordnung Position → Grauwert 

Histogramm Einebnung: Betrachte eine stetige 

(streng) montonon steigende (und damit bijektive) 

Punktoperation s = T (r), deren Inverse T −1 ebenfalls 

monton steigt. Zur Einfachheit sei T : [0, 1] → 

[0, 1]. Mit pr, ps seien im Folgenden die Wahrscheinlichkeitsdichten 

bezeichnet für die Zufallsvariable 

R, S = T (R), die den Grauwert eines zufällig ausgewählten 

Pixels vor bzw. nach der Transformation 

T angeben. Es folgt: 

b 

Pr(T (a) ≤ S < T (b)) = pr(r)dr 

T (b) 

a 

= pr(T 

T (a) 

−1 (s))(T −1 ) ′ (s)ds (Subst.) 

=⇒ps(s) = d 

Pr(S < s) 

ds 

(Def. der Dichte) 

=pr(T −1 (s))(T −1 ) ′ (s) = pr(r) dr 

ds 

(37) 

Für die Einebnung gewünscht ist ps(s) = 1 für 0 ≤ 

s ≤ 1 (und 0 sonst). Definiere: 

r 

s = T (r) := pr(t)dt (0 ≤ r ≤ 1) (38) 

Hiermit folgt: 

pr(r) = ds 

dr 

0 

= (dr 

ds )−1 

(39) 

ps(s) = pr(r) 1 

= 1 (40) 

pr(r) 

Die Einebnung im diskreten Fall (es stehen k Graustufen 

r0, . . . , rk zur Verfügung): nj bezeichne die 

Anzahl der Pixel mit Grauwert rj, N die Gesamtpixelzahl. 

Es gelten (analog zu (38)) folgende Definitionen: 

pr(rj) := nj 

N 

sk = T (rk) := 

(41) 

k 

pr(rj) (42) 

j=0 

5. Filteroperationen 

Digitale Bildverarbeitung 5. Filteroperationen 

Darstellung":=;H:8>=;:E67B Nachbarschaft: 

25 June, 2004 

Pixel an Stelle x,y 

Direkte Nachbarn – 4er Nachbarschaft 

Indirekte Nachbarn 

8er Nachbarschaft 

Grafische Darstellung 

einer Faltung: Multi- Page 4 

plizieren,Aufsummieren, Zentrumspixel ersetzen 

Einige Filter: 

Boxcar: 1 

9 · 

Gauss: 1 

8 · 

1 1 1 

1 1 1 

1 1 1 

0 1 0 

1 4 1 

0 1 0 

Digitale Bildverarbeitung 

!"#$%&'#()*+,*-./%&0+&" 

!"#$%&'#()*+,*-./%&0+&" 

12345678*98:4;?*$5:@





Sobel: 

Laplace: 

−1 −2 −1 

0 0 0 

1 2 1 

0 1 0 

1 −4 1 

0 1 0 

oder 

1 1 1 

1 −8 1 

1 1 1 

(mit Diag.) 

Erste partielle Ableitungen eines Bildes f(x, y) 

(Gradient): 

∇f(x, y) = 

 

∂f 

∂x 

∂f = 

∂y 

 

f(x + 1, y) − f(x, y) 

f(x, y + 1) − f(x, y) 

(45) 

Der Gradient zeigt in die Richtung des maximalen 

Anstiegs von f. 

Zweite partielle Ableitungen ( ∂2 f 

∂y 2 analog): 

∂ 2 f 

∂x 2 = f(x + 1, y) − f(x, y) − 

f(x, y) − f(x − 1, y) 

=f(x + 1, y) − 2f(x, y) + f(x − 1, y) 

(46) 

Dies entspricht dem Laplace-Filter. 

1 1 1 

Laplace mit 1 −8 1 entspricht ebenfalls einem 

1 1 1 

Unscharf Maskieren, d. h. Kantenverstärktest Bild 

= c · Originalbild − geglättetes Bild. 

Der Filterkern summiert sich auf 1 bei einem 

Glättungsfilter, um die Skalierung der Grauwerte 

zu behalten, und summiert sich auf 0 bei einer Kantenerkennung, 

so dass bei Filterung über ein homogenes 

Bild das Ergebnis 0 bleibt (keine Kanten). 

Ergebnisse: 1. Ableitung erzeugt dickere Kanten, 2. 

Ableitung dünnere. Insb. die 2. Ableitung verstärkt 

Rauschen stark durch ” ringing“, ” double edges“ 

Ein Tiefpassfilter lässt nur ” niedrige“ Frequenzen 

durch, um so Störungen mit hohen Frequenzen 

zu eliminieren. Dies ist intuitiv im Frequenzbereich 

möglich: Sei F (u, v) die Transformation eines 

Bildes f(x, y). Gesucht ist nun ein H(u, v), so 

dass die Rücktransformation g(x, y) von G(u, v) = 

H(u, v)F (u, v) ein entstörtes (weichgezeichnetes) 

Bild ergibt. Ideal wäre also (im kontinuierlichen 

Fall), wenn sämtliche Frequenzpaare (u, v), deren 

6 

(absolutes) geometrisches Mittel größer einer bestimmten 

Frequenz D0 ist, ausgefiltert werden: 

D(u, v) := u2 + v2 

(47) 

H(u, v) = 

1 

0 

wenn D(u, v) ≤ D0 

sonst 

(48) 

Der Butterworth Filter hat im Unterschied keinen 

scharfen Abschnitt: 

1 

H(u, v) = 

1 + D(u,v) (49) 

2n 

D0 

Hochpassfilter ist analog definiert – im idealen Fall 

bspw. H ′ (u, v) := 1 − H(u, v). 

Homomorphic Filtering: Ein Bild f(x, y) kann aus 

zwei Komponenten zusammengesetzt gedacht werden: 

f(x, y) = ι(x, y) · ρ(x, y), wobei 0 < ι < ∞ die 

Beleuchtung angibt, 0 < ρ < 1 die Reflektion. Da 

die FT bzgl. der Multiplikation nicht strukturverträglich 

ist (allerdings bzgl. der Addition) und es 

manchmal wünschenswert ist, auf beiden Komponenten 

separat zu arbeiten, kann das Filterergebnis 

g(x, y) wie folgt folgt gewonnen werden: 

z(x, y) := ln f(x, y) 

F{f ′ (x, y)} 

 

:=Z(u,v) 

= ln ι(x, y) + ln ρ(x, y) 

= F{ι(x, y)} 

 

:=I(u,v) 

+ F{ρ(x, y)} 

 

:=R(u,v) 

Es werde nun der Filter H(u, v) angewandt: 

g(x, y) = exp(F −1 {H(u, v)Z(u, v)}) 

= exp(F −1 {H(u, v)I(u, v)}+ 

F −1 {H(u, v)R(u, v)}) 

= exp(F −1 {H(u, v)Z(u, v)})· 

exp(F −1 {H(u, v)R(u, v)}) 

(50) 

(51) 

(52) 

Zusammenfassend: f(x, y) → ln → FFT → 

H(u, v) · ⋆ → FFT −1 → exp → g(x, y) 

6. Restauration 

Restaurierung 

Modell im Orts- und Fourier-Bereich: 

g(x, y) = f(x, y) 

 

∗ h(x, y) 

 

+ n(x, y) 

 

Originalbild Degradierung 

” noise term“ 

(53) 

G(u, v) =F (u, v)H(u, v) + N(u, v) (54)





Inverse Filtering, Näherung für Original: 

ˆF 

G(u, v) N(u, v) 

(u, v) = − 

H(u, v) H(u, v) 

(55) 

Problematisch beim Inverse Filtering sind Fälle, in 

denen H(u, v) sehr kleine Werte annimmt (oder – 

schlimmer noch – sogar ganz verschwindet). 

Der Least Mean Square (LMS) Filter, wobei 

Sf (u, v) und Sn(u, v) das Leistungssprektrum von 

fe bzw. ne darstellen (den für die diskrete Faltung 

mit 0en erweiterten Funktionen f und n): 

ˆF (u, v) = 

H(u, v) 

|H(u, v)| 2 + γ( Sn(u, v) 

Sf (u, v) ) 

 

=:k 

· G(u, v) 

(56) 

Wenn Sn und Sf unbekannt, so muss k selbst bestimmt 

werden. 

Der LMS für γ = 1 heißt Wiener Filter. Für ihn 

gilt: E[(f(x, y) − ˆ f(x, y)) 2 beitung 6. Restaurieren / Segmentieren / Pyramiden 

rauwertberechnung! 

] wird minimal. 

t neighbor Geometrische (zero-order Verzerrung interpolation) - Nächste 

arschaft 

spatial transformation 

(x,y) 

Gray-level transformation 

( xˆ 

, yˆ 

) 

nearest neighbor 

Neue Grauwertberechnung: Nearest Neighbor oder 

bilineare Interpolation. Faustregel: Backward 

” 

re Interpolation oder kubische Interpolation 

ard mapping” mapping“ sinnvoller als “forward forward mapping“. 

” mapping” 

Segmentierung 

!"#$%&'#()*+,*-./%&0+&" 

!"#$%&'#()*+,*-./%&0+&" 

12345678*98:4;?*$5:@





(lossy) Kodierungen: Pyramidenebenen weglassen, 

im YIC-Farbmodell nur die Helligkeit mit voller 

Auflösung, im RGB Würfel Farbwerte neu quantisieren, 

bei der Cosinus-Transformation nur die 

” wichtigen“ Werte speichern 

Schema für Kodierung (Verlust tritt beim Quantizer 

auf): 

f(x, y) → Mapper → Quantizer → 

Symbol encoder → Channel 

Dekodierung: Channel → Symbol decoder → 

Inverse Mapper → ˆ f(x, y) 

Schema beim JPEG: Mapper transformiert 

von RGB in Helligkeitsmodell (hier kann Verlust 

auftreten) und nimmt diskrete Cosinus- 

Transformation (DCT) vor, Quantizer kann 

Auflösung der DCT-Werte vergröbern, Symbol encoder 

benutzt Huffman und Lauflängen-Codierung 

Digitale Bildverarbeitung 7. Kompression 

Rechts: DCT Komponenten 

geordnet nach Frequenz. Bei 

JPEG werden die Werte 

Digitale Bildverarbeitung 

nach Wichtigkeit“ quanti- 

7. Kompression 

” 

siert. Die Folge der Komponenten 

links oben wird 

für alle 8 × 8-Matrizen Huffman 

kodiert. Die jeweils anderen 

Komponenten werden geordnet nach Frequenzen 

(also in Pfeilrichtung) abgespeichert und 

Lauflängen-kodiert (es treten viele 0en auf). 

DCT Komponenten geordnet 

nach Frequenzen 

25 June, 2004 

Wavelet-Komprimierung: Zerlegung des Bildes 

in eine Skalierung und 3 Wavelets (horizontal, 

vertikal, diagonal). Verlustfreie Rekonstruktion 

möglich, wenn keine Quantisierung vorgenommen 

wurde. Eignung für Pyramiden: 

5 June, 2004 

8 

Page 31 

Quantisierung 

Das Auge reagiert nicht 

gleich auf unterschiedliche Frequenzen. 

Deshalb werden die Zahlen 

nach „Wichtigkeit“ quantisiert. 

Komponenten von weniger wichtigen 

Frequenzen werden dabei gröber 

quantisiert als von wichtigen 

Frequenzen. Es wird meist auf die 

Konstruktion der 

DWT der Ebene 

j aus der Ebene 

nächste ganze Zahlen gerundet. 

j+1 

Page 25 

!"#$%&'#()*+,*-./%&0+&" 

!"#$%&'#()*+,*-./%&0+&" 

12345678*98:4;?*$5:@

Zusammenfassung Digi- tale Bildverarbeitung

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?