Rot-Schwarz-Baum

8.4 Rot-Schwarz-Bäume 

Effiziente Algorithmen 

� Rot-Schwarz-Bäume (red-black trees) sind erstmals von Guibas & 

Sedgewick 1978 vorgestellt worden. 

– Rot-Schwarz-Bäume stellen eine Art “abstrakte Klasse” dar, die 

genutzt werden kann, um verschiedene binäre Suchbäume einfach zu 

implementieren 

implementieren. 

� Die in diesem Abschnitt vorgestellte Variante der Rot-Schwarz-Bäume ist 

in der Java API (java.util.TreeMap) implementiert. 

– Sie entspricht den symmetrischen binären B-Bäumen, die bereits 1972 

von Rudolf Bayer entwickelt wurden. 

– Eine detaillierte Beschreibung der Datenstruktur findet man in dem 

Buch von Cormen et al. 

Seite 217

2-4-Bäume 


2-4-Bäume 

� Ein 2-4-Baum ist ein a-b-Baum mit a = 2 und b = 4. In der Literatur spricht p 

man auch von 2-3-4-Bäumen. 

Lemma: 

� Alle Knoten eines 2-4-Baums lassen sich in Form eines AVL-Baums 

darstellen. 

Beweis: 

a) binäre Knoten b) tenäre Knoten c) Konten mit 4 Kinder 

Seite 218


Rot-Schwarz-Baum (RS-Baum) ( ) 

Einfärbung der Knoten in einem AVL-Baum: 

� Die Wurzel eines AVL-Baums wird schwarz eingefärbt. g 

– Blattknoten sind per Definition schwarz. 

� Die anderen Knoten werden rot eingefärbt. 

k 2 k 2 k 1 

k 1 

Für den aus dem 2-4-Baum äquivalenten binären Baum gilt: 

1. Die Wurzel des binären Baums ist schwarz. 

2. Die Kinder eines roten Knotens sind schwarz. 

3. Jeder Pfad von der Wurzel zu einem Blatt besitzt die gleiche Anzahl von 

schwarzen Knoten. Knoten Diese Anzahl bezeichnen wir als S-Höhe. S Höhe. 

k 2 

k 1 

k 2 

k 3 

Seite 219

Eigenschaften 

g 

� Ein Rot-Schwarz-Baum ist ein binärer Suchbaum. 

� Der Suchalgorithmus g ist identisch zu binären Suchbäumen. 


� Da die Höhe der 2-4-Bäume logarithmisch beschränkt ist, folgt sofort auch, 

dass die Höhe eines Rot-Schwarz-Baums O(log n) beträgt. 

�� Die i Länge zweier i Pfade f d in i einem i RS-Baum unterscheidet hid sich ihh höchstens h 

um den Faktor 2 

Seite 220

Einfügen g und Löschen 


� Einfügen und Löschen unterscheiden sich aber jetzt von natürlichen 

Suchbäumen. 

� Einfügen 

– Zunächst wird wie beim natürlichen Suchbaum durch eine Suche die 

Einfügeposition bestimmt und ein neuer roter Knoten eingefügt eingefügt. 

– Problem: Vaterknoten existiert nicht oder ist rot! 

� Löschen 

– Zunächst wird wie beim natürlichen Suchbaum der Schlüssel entfernt 

(ggf. durch Bestimmung des sym. Nachfolgers). 

�� Dadurch ist garantiert, garantiert dass ein Eintrag aus einem Knoten 

über den leeren Blättern gelöscht wird. 

– Problem: Der zu entfernende Knoten ist schwarz! 

Seite 221


Einfügen g (Fall ( 1: kein Elternknoten) ) 

� Wir betrachten zunächst den einfachen Fall, dass ein roter Knoten 

eingefügt wurde, aber kein Wurzelknoten vorhanden ist. 

– Wir färben dann den Knoten schwarz. Der Knoten wird dann zur neuen 

Wurzel des RB-Baums. 

k k 

Seite 222


Einfügen g (Fall ( 2: Elternknoten ist rot) ) 

� Im Rest der Diskussion nehmen wir an, dass der Vaterknoten des neuen 

Knotens auch rot gefärbt ist. 

k 

k 1 

�� Zudem nutzen wir aus, aus dass ein RB-Baum auch als 2-4-Baum gesehen 

werden kann. Dies vereinfacht die Fallbetrachtungen! 

– Im Wesentlichen müssen (abgesehen von Symmetrien) nur zwei Fälle 

bbetrachtet h werden. d 

a) Der Schlüssel k wird in ein Knoten des 2-4-Baums eingefügt, der 

bereits voll ist. 

b) Der Schlüssel k wird in ein ternären Knoten des 2-4-Baums 

eingefügt, der noch Platz hat. 

– MMan bbeachte, h ddass wir i dden FFall ll eines i binären bi ä Knotens K überhaupt üb h nicht i h 

betrachten müssen. 

Seite 223

T 1 

T 1 

k 

k 

k 1 

T 2 


Fall 2a: Knoten des 2-4-Baums ist voll 

T 3 

k 2 

T 4 

k 3 

T 5 

� Ausgangslage 

– Farbinvariante ist verletzt 

– 2-4-Knoten ist zu voll 

– T1,…,T5 sind RB-Baum mit gleicher 

S-Höhe h 

Lösung 

� Überlaufbehandlung 

k2 – Erzeuge zwei neue 2-4-Knoten und 

färbe die Knoten so, dass die 

k 1 

k 3 

Farbinvariante erfüllt ist ist. 

– Färbe die ursprüngliche Wurzel rot 

und füge sie in den Vaterknoten ein. 

� rekursive Vorgehensweise 

T 2 

T 3 

T 4 

T 5 

Seite 224

T 1 

T 1 

k 


Fall 2b: Knoten des 2-4-Baums ist nicht voll 

k 1 

T 2 

T 3 

k 1 

k 2 

T 4 

k k 2 Knotens. 

k k 2 

T 2 

T 3 

T 4 


– Farbinvariante ist verletzt 

– 2-4-Knoten ist nicht zu voll 

– Teilbäume T1,…,T4 sind RB- 

Bäume mit igleicher lih S-Höhe h 

Lösung 

� Rechtsrotation im 2-4-Knoten 

– Binärknoten mit Schlüssel k1 

wird zur Wurzel des 2-4- 

Knotens 

– Umfärbung der Binärknoten 

� FERTIG 

Seite 225

T 1 

T 1 

k 1 

T 2 

k 1 


Haben wir nicht diesen Fall vergessen? g 

k 


– Wie auf der letzten Folie, aber 

der neue Knoten ist jetzt das 

rechte Kind 

k 2 , 

T 3 

T 4 

k Lösung: 

2 

� Durch eine Linksrotation 

k 

überführen wir diesen Fall in den 

bereits zuvor behandelten Fall. 

T 2 

T 3 

T 4 

Seite 226

Laufzeit 


Satz 

� Das Einfügen g in einem Rot-Schwarz-Baum mit n Elementen hat Aufwand 

O(log n). Es werden höchstens zwei Rotationen pro Einfügeoperation 

benötigt. 

Beweis 

� Die (S-)Höhe ( ) des RB-Baums ist log g n. 

� Die Suche ist auf einen Pfad beschränkt. 

� Die globale Reparatur des Baums läuft auf den Suchpfad rückwärts in 

Ri Richtung h Wurzel W l und d führt f h lokale l k l Reorganisationen R i i aus. 

– Wird dabei rotiert (maximal 2x), ist die Reparatur abgeschlossen. 

– Eine lokale Reorganisation benötigt konstante Zeit. Zeit 

– Gegebenenfalls wird noch eine neue Wurzel für den RB-Baum 

erzeugt. 

� Die Kosten sind somit O(log n) und die Anzahl der Rotation beträgt 

höchstens 2 

Seite 227

Löschen 


� Fall der zu löschende Knoten rot gefärbt ist, wird keine Reorganisation 

benötigt und die Struktur des RB-Baums bleibt unverändert. 

� Wird ein schwarzer Knoten in einem ternären Knoten gelöscht, so kann das 

Kind zur Wurzel des 2-4-Knotens gemacht werden. 

�� Auch in diesem Fall bleibt die Struktur des RB-Baums RB Baums unverändert. 

unverändert 

k k 1 

k 1 

� Wir brauchen also nur den Fall eines binären 2-4-Knotens zu betrachten. 

k 

– Sonderfall: Binärer Knoten ist die Wurzel des RB-Baums 

• Dann ist der Baum nach dem Löschen leer! 

– Wie beim 2-3-Baum betrachten wir den Elternknoten P und den 

Geschwisterknoten R Seite 228

P 

R 

k 2 

k 1 

k 3 


Fall 1: Elternknoten nicht binär 

B 

� Elternknoten P ternär 

� Es gibt g ein 2-4-Geschwisterknoten 

R, der nicht voll ist. 

– Durch eine Rotation im 

Elternknoten P kann man sich 

ein Knoten R erzeugen. 

� B ist leer und hat keinen 

schwarzen Binärknoten. 

P 

k1 Lösung: 

� Nimm den binären Knoten aus der 

Wurzel und erzeuge mit den 

k3 Binärknoten aus R und dem 

k2 Verweis aus B einen neuen 2-4- 

Knoten. 

– Ggf. muss man hier rotieren 

FERTIG 

Seite 229

P 

R 

k 2 

k 3 

k 1 

k 4 

k 5 


Fall 1: Elternknoten nicht binär 

B 

� Elternknoten P ternär 

� Es gibt g ein 2-4-Geschwisterknoten 

R, der voll ist. 

� B ist leer und hat keinen schwarzen 

Binärknoten Binärknoten. 

Lösung: 

� Durch maximal 2 Rotationen 

können nun die Binärknoten 

umverteilt werden, so dass B 

wieder einen schwarzen Knoten 

bekommt bekommt. 

Seite 230

R 

P 

k 1 

P 

k k1 k 2 

k 2 

Fall 2: Elternknoten binär 

B 

� P binär, R binär 

� B ist leer 


Lösung 

� Nimm Binärknoten aus P und 

verschmelz diesen mit dem 

Knoten aus R. 

�� P hat keinen schwarzen Knoten 

mehr. 

� Rekursive Vorgehensweise 

Seite 231

R 

R 

P 

k 1 

P 

k 2 

k 1 

k 3 

k 2 

Fall 2: Elternknoten binär 

k 3 

B 

B 

� P binär, R ist nicht binär 

� B ist leer 

Lösungg 


� Durch Rotation können die 

Binärknoten über die 2-4 Knoten 

wieder verteilt werden, werden so dass alle 

Invarianten erfüllt sind. 

FERTIG 

Seite 232

Laufzeit 


Satz: 

� Das Löschen in einem Rot-Schwarz-Baum mit n Elementen hat Aufwand 

O(log n). Es werden höchstens drei Rotationen pro Löschoperation 

benötigt. 

Beweis 

� Die (S-)Höhe ( ) des RB-Baums ist log g n. 

� Die Suche ist auf einen Pfad beschränkt. 

� Die globale Reparatur des Baums läuft auf den Suchpfad rückwärts in 

Ri Richtung h Wurzel W l und d führt f h lokale l k l Reorganisationen R i i aus. 

– Wird dabei rotiert (höchstens 3x), ist die Reparatur abgeschlossen. 

– Eine lokale Reorganisation benötigt konstante Zeit. Zeit 

– Gegebenenfalls wird die Wurzel des RB-Baum gelöscht (und das 

einzige Kind zur neuen Wurzel gemacht). 

� Die Kosten sind somit O(log n) und die Anzahl der Rotation beträgt 

höchstens 3. 

Seite 233

Problem: 

� Gegeben: g 


8.5 Optimale p binäre Suchbäume 

– eine Menge von Datensätzen {r1,…rn} – Zugriffswahrscheinlichkeit pi für den Datensatz ri, 1 � i � n. 

– Sei ein Suchbaum B für die n Datensätze gegeben und sei di die Tiefe 

des Knotens, wo der Datensatz ri platziert ist. Dann betragen die 

erwarteten Zugriffskosten g : 

� Gesucht: 

– Suchbaum B Bmin mit 

n 

� 

i�1 

� 

� � p B EC ) 1 ( ) ( 

i i d i i 

EC B ) � min B 

( min 

EC( 

B) 

Seite 234

Beispiel p 

� Wir betrachten ein Beispiel bestehend aus folgenden 7 Datensätzen 

(Wörtern): 

Datensatz Wahrscheinlichkeit 

ab 0,22 

am 018 0,18 

an 0,2 

es 0,05 

in 0,25 

so 0,02 

zu 008 0,08 

� Lösungen 

– GGreedy-Algorithmus d Al i h 

• Element mit höchster Wahrscheinlichkeit in der Wurzel 

– Perfekt balancierter Baum 

• Mittleres Element (Median) in die Wurzel 


Seite 235

in 

Beispiel p ( (2) ) 

es 


abb zu am 

so abb 

iin 

an so 

ab an 

in zu 

an 

am es zu 

am es so 

Greedy-Baum 

Kosten: 2,43 

Balancierter Baum 

Kosten: 2,7 

Optimaler Suchbaum 

Kosten: 2,15 

Bemerkung 

� Greedy-Verfahren führt nicht zur optimalen Lösung. Gründe hierfür sind: 

– Der binäre Baum besitzt nicht nur die Daten in den Blattknoten 

– Der binäre Baum muss noch die Eigenschaft eines Suchbaums erfüllen. 

� Und jetzt? j 

Seite 236

Lösungsidee g 


� Sei r L, r L+1, …, r R eine aufsteigend sortierte Folge von Datensätzen, die wir 

in einem Suchbaum speichern möchten. Nehmen wir nun an, daß r i die 

Wurzel des optimalen Suchbaums sei, L � i � R. Dann gilt: 

R 

�� 

j� L 

EC( 

T ) pi 

� EC( 

T1) 

� EC( 

T2 

) 

� Offensichtlich kann EC(T) nur dadurch minimiert 

werden, wenn T1 und T2 wiederum optimale 

binäre Suchbäume sind. 

� Aus den R-L Möglichkeiten der Erzeugung 

optimaler Paare von Teilbäumen, Teilbäumen wählen wir 

uns das Paar, das die Gesamtkosten 

T1 minimiert. 

�� Wlh Welches Verarbeitungsparadigma V bi di soll llangewendet d werden? d ? 

r i 

T 2 

Seite 237

Analyse y 


� Algorithmus 

– Wir erzeugen g uns mittels dynamischen y Programmierens g alle optimalen p 

Suchbäume Tij mit j ≥ i, die genau die Elemente ri,..,rj enthalten. 

• Genauer gesagt berechnen wir zunächst die minimalen Kosten und 

merken uns noch den „Splitwert“. Splitwert“ 

– Die Berechnung erfolgt Bottom-up: 

• Die Kosten für T11,…,T 11, , nn sind durch p p1,…,p 1, ,p n gegeben. gg 

• Danach erzeugen wir uns durch Anwendung der rekursiven 

Gleichung (siehe oben) die optimalen BäumeTi i+j, die eine 

Teilfolge von j+1 Datensätzen enthalten, enthalten j=1,…,n-1. j=1 n 1 

Satz 

� Der optimale Suchbaum kann in O(n3 ) Zeit und O(n2 ) Speicherplatz 

berechnet werden. 

Seite 238

Rot-Schwarz-Baum

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?