Gebalanceerde Bomen

Gebalanceerde Bomen 

algoritmen voor binaire bomen werken goed voor verschillende soorten 

toepassingen maar hun ‘worst case’ gedrag zorgt voor problemen 

balanceren is een techniek die ervoor zorgt dat het slechtste geval 

zich niet kan voordoen maar implementatie is niet eenvoudig 

1

Top-down 2-3-4 Bomen 

om ‘worst cases’ te vermijden is flexibiliteit nodig in de datastructuren, 

we veronderstellen dat knopen meer dan 1 sleutel kunnen bevatten 

we laten 3-knopen en 4-knopen toe (die 2 en 3 sleutels kunnen bevatten) 

uit een 3-knoop komen 3 links: 1 naar alle records met sleutels kleiner 

dan beide knopen, 1 met alle records waarvan de sleutels tussen de 2 

knopen liggen en 1 met alle grotere sleutels 

uit een 4-knoop komen 4 links: een voor elk interval dat door de 3 

knopen gedefinieerd is 

2

Fig. 1 Een 2-3-4 boom. 

3

zoeken is eenvoudig 

bvb. zoeken naar G in de boom van Fig.1: 

volg de middenste link van de wortelknoop (G ligt tussen E en R); 

volg de linkse link in de volgende knoop (knoop met H, I en N) en 

beëindig het zoeken zonder succes 

4

nieuwe knoop toevoegen: na een niet succesvolle zoektocht de knoop 

inhaken; wanneer de zoektocht eindigt in een 2-knoop maken we er 

een 3-knoop van 

bvb. X toevoegen in Fig.1 door X (en een extra link) toe te voegen 

aan de knoop die S bevat 

analoog kan van een 3-knoop een 4-knoop gemaakt worden 

5

wat als er een nieuwe sleutel toegevoegd moet worden aan een 4knoop? 

bvb. G toevoegen aan de boom in Fig.1 

betere oplossing dan er een 5-knoop van te maken in Fig.2 

• splits de 4-knoop in 2 2-knopen en geef één van de sleutels door 

aan zijn ouder 

• voeg daarna de nieuwe sleutel toe 

6

Fig. 2 Toevoegen (van G) aan een 2-3-4 boom 

7

toevoegen van sleutels aan een boom: 

wanneer er een sleutel doorgegeven moet worden aan een ouder die 

al een 4-knoop is 

een methode kan zijn om ook de ouder te splitsen (maar de hogere 

niveaus kunnen ook 4-knopen zijn ...) 

een eenvoudiger methode zorgt ervoor dat geen enkele ouder van 

een knoop in de boom een 4-knoop is door alle 4-knopen te splitsen 

tijdens het afdalen in de boom 

8

Fig. 3 Constructie van een 2-3-4 boom voor de volledige verzameling 

sleutels (A S E A R C H I N G E X A M P L E) 

9

een 2-knoop verbonden met een 4-knoop wordt getransformeerd in 

een 3-knoop verbonden met 2 2-knopen 

een 3-knoop verbonden met een 4-knoop kan getransformeerd worden 

in een 4-knoop verbonden met 2 2-knopen 

splitsen werkt omdat niet enkel de sleutels maar ook de verwijzingen 

verplaatst kunnen worden 

voordeel: alle bewerkingen zijn lokale transformaties (zie Fig. 4) 

10

Fig. 4 Splitsen van 4-knopen. 

11

wanneer de wortel een 4-knoop wordt splitsen we hem in 3 2-knopen 

(we hoeven niet te wachten op de volgende invoeging omdat er geen 

probleem kan zijn met de ouder van de wortelknoop) 

enkel bij het splitsen van de wortelknoop komt er een niveau bij in de 

boom 

op die manier verkrijgen we een gebalanceerde boom 

12

Eig. 1 Tijdens zoeken in 2-3-4 bomen met N knopen worden niet 

meer dan lgN + 1 knopen bezocht. 

De afstand van de wortel tot elke externe knoop is immers dezelfde. 

13

Eig. 2 Invoegen in 2-3-4 bomen met N knopen vergt minder dan 

lgN + 1 keer splitsen van knopen in het slechtste geval en gemiddeld 

minder dan 1 knoop. 

In het slechtste geval zijn alle knopen op het pad van de invoeging 

4-knopen, die allemaal gesplitst moeten worden. 

14

Fig. 5 Grote 2-3-4 boom 

voorbeeld in Fig. 5: boom opgebouwd met een random permutatie 

van 95 elementen 

de boom bevat 9 4-knopen, waarvan er maar 1 niet op het laagste 

niveau zit 

15

Rood-zwarte bomen 

2-3-4 bomen kunnen als standaard bomen voorgesteld worden door 1 

extra bit per knoop te gebruiken 

we veronderstellen dat 3-knopen en 4-knopen kleine binaire bomen 

zijn die met ‘rode’ verbindingen samenhangen, de ‘zwarte’ verbindingen 

houden de 2-3-4 bomen samen (rode verbindingen zijn voorgesteld 

als dikke lijnen in Fig. 6) 

16

Fig. 6 Rood-zwart voorstelling van 3-knopen en 4-knopen 

17

een voorstelling van de boom in Fig. 3 (er zijn verschillende representaties 

mogelijk 

Fig. 7 Rood-zwarte boom 

18

de ‘schuinte’ van de 3-knopen heeft geen belang (Fig. 6) 

met een 2-3-4 boom komen verschillende rood-zwart bomen overeen 

eigenschappen: 

• er zijn nooit twee opeenvolgende rode verbindingen op een pad 

van de wortel naar een externe knoop 

• elk van die paden heeft een zelfde aantal zwarte verbindingen 

het is nog altijd mogelijk dat een pad (afwisselend rood-zwart) twee 

keer zo lang is als een ander (volledig zwart) maar de padlengtes zijn 

allemaal evenredig met logN. 

19

de positie van duplicaten is opmerkelijk (zie Fig.7) 

als we niet zouden toelaten dat duplicaten zich aan beide zijden van 

een knoop kunnen bevinden kan de boom sterk uit balans geraken 

wanneer er veel duplicaten zijn 

belangrijke eigenschap: de zoekprocedure voor standaard zoeken in 

binaire bomen werkt ongewijzigd (behalve in het geval van gedupliceerde 

sleutels; we kunnen niet alle knopen met een gegeven sleutel 

vinden door de zoekprocedure verder te zetten) 

20

kleuren implementeren door 1 bit veld toe te voegen aan elke knoop, 

(een 1 wanneer de link die naar de knoop wijst rood is, een 0 wanneer 

die zwart is); de zoekprocedure bekijkt dat veld nooit 

het balanceermechanisme veroorzaakt bijgevolg geen overlast 

het zoeken is efficiënter omdat de boom gebalanceerd is 

er is ook heel weinig overlast door de invoegprocedure (er moet alleen 

gehandeld worden als er een 4-knoop is) 

21

void Dict::insert(itemType v, infoType info) 

{ 

x = head; p = head; g = head; 

while (x != z) 

{ 

gg = g; g = p; p = x; 

x = (v < x-> key) ? x->l : x->r; 

if (x->l->b && x->r->b) split(v); 

} 

x = new node(v, info, 1, z, z); 

if (v < p->key) p->l = x; else p->r = x; 

split(v); head->r->b=black; 

} 

22

Fig. 8 Toevoegen (van Y) aan rood-zwarte boom van Fig. 7 

23

er is een transformatie nodig wanneer we tegenkomen: 

• een 2-knoop die met een 4-knoop verbonden is 

• een 3-knoop die met een 4-knoop verbonden is (3 verschillende 

mogelijkheden: Fig. 9 en Fig. 10) 

24

Fig. 9 Splitsen van 4-knopen met een kleurwissel 

25

Fig. 10 Splitsen van 4-knopen met een kleurwissel: er is rotatie nodig. 

26

wanneer in Fig. 8 de links y, c en gc verwijzen naar I, R en N, gebeurt 

de transformatie naar Fig. 11 door de veranderingen: 

c->l = gc->r; 

gc->r = c; 

y->r = gc 

er zijn 3 andere analoge gevallen: de 3-knoop kan anders georiënteerd 

zijn of kan zich aan de linkerkant van y bevinden (in beide oriëntaties) 

27

Fig. 11 Roteren van een 3-knoop in Fig. 8. 

28

om alle vier de gevallen te behandelen gebruiken we de zoeksleutel 

v om het relevante kind (c) en het relevante kleinkind (gc) terug te 

vinden (3-knopen worden alleen opnieuw georiënteerd wanneer het 

zoeken ons naar de bodem van de boom geleid heeft) 

eenvoudiger dan wanneer we niet enkel c en gc moeten onthouden 

maar ook of ze linkse of rechtse links zijn 

29

struct node *rotate(itemType v, struct node *y) 

{ 

struct node *c, *gc; 

c = (v < y->key) ? y->l : y->r; 

if (v < c->key) 

{ gc = c->l; c->l = gc->r; gc->r = c; } 

else 

{ gc = c->r; c->r = gc->l; gc->l = c; } 

if (v < y->key) y->l = gc; else y->r = gc; 

return gc; 

} 

30

de functie brengt de link terug naar de top van de 3-knoop maar voert 

zelf de kleurwissel niet uit 

voor het derde geval van split (Fig. 10): 

• stel g rood 

• stel x gelijk aan rotate(v, gg) 

• stel x zwart 

hiermee is dit geval gereduceerd tot het tweede geval (waar de 3knoop 

goed georiënteerd was) 

31

voor het vierde geval (twee links georiënteerd in verschillende richtingen; 

Fig. 10): 

stel p gelijk aan rotate(v, g) 

de illegale 3-knoop bestaande uit 2 knopen waarnaar door p en x 

verwezen werd is anders georënteerd 

alle knopen hebben dezelfde kleur, er is geen kleurwissel nodig en we 

vervallen in het derde geval (leidt tot een dubbele rotatie) 

32

Fig. 12 Splitsen van een knoop in een rood-zwart boom. 

33

Fig. 12 demonstreert de uit te voeren split wanneer G wordt toegevoegd 

eerst is er een kleurwissel (split) om de 4-knoop die H, I en N bevat 

te splitsen 

daarna is er een dubbele rotatie nodig: eerst rond de boog tussen I 

en R, daarna rond de boog tussen E en I 

na deze wijzigingen kan G toegevoegd worden links van H (Fig 13) 

34

Fig. 13 Bouwen van een rood-zwarte boom. 

35

wanneer de wortel een 4-knoop is (invoegen in de eerste boom van 

Fig. 13 maakt de split procedure de wortel rood: dit komt overeen 

met het transformeren, samen met de dummy knoop erboven tot een 

3-knoop 

er is geen enkele reden om dat te doen; vandaar dat er een expliciet 

in de code staat de wortel zwart te houden 

36

void split(itemType v) 

{ 

x->b = red; x->l->b = black; x->r->b = black; 

if (p->b) 

{ 

g->b = red; 

if (vkey != vkey) p = rotate(v, g); 

x = rotate(v, gg); 

x->b = black; 

} 

} 

37

de split procedure zorgt ervoor dat alle kleuren correct zijn na de 

rotatie en plaatst x voldoende hoog in de boom om ervoor te zorgen 

dat we niet verloren lopen in de zoektocht na alle wijzigingen van de 

links 

38

de klasse declaratie voor rood-zwarte bomen is precies dezelfde als 

voor binaire zoekbomen, er is alleen een extra binair veld b in node 

de dummy knopen in de Dict constructor moeten op de volgende 

manier geïnitialiseerd worden: 

Dict(int max) 

{ 

z = new node( 0, infoNIL, black, 0, 0); 

z->l = z; z->r = z; 

head = new node(itemMIN, 0, black, 0, z); 

} 

39

Fig. 14 Bouwen van een rood-zwarte boom. 

40

Eig.3 Zoeken in een rood-zwarte boom met N knopen opgebouwd 

met random sleutels heeft ongeveer lgN vergelijkingen nodig, en voor 

een invoeging is gemiddeld minder dan 1 rotatie nodig. 

Het is vooral voor het worst-case gedrag dat gebalanceerde bomen 

zo aantrekkelijk zijn. 

41

Fig. 15 Een rood-zwarte boom voor een ontaard geval (opgebouwd 

door de getallen 1 tot 95 in volgorde toe te voegen aan een lege 

boom). 

42

Eig.4 Zoeken in een rood-zwarte boom met N knopen vergt minder 

dan 2 lg N+2 vergelijkingen en een toevoeging vergt minder rotaties 

dan een kwart van de vergelijkingen. 

43

Andere algoritmen 

Er bestaan andere analoge strategieën voor het implementeren van 

gebalanceerde binaire bomen. Het is vooral de rotatie die de bomen 

balanceert. 

Oudste en best gekende gebalanceerde boom is de AVL boom. Die 

heeft de eigenschap dat de hoogte van de twee deelbomen van elke 

knoop ten hoogste met 1 verschilt. Wanneer deze voorwaarde overtreden 

wordt door het toevoegen van een knoop, dan kan er terug 

aan voldaan worden door te roteren. 

44

Een andere gekende structuur voor gebalanceerde bomen is de 2-3 

boom, waarin enkel 2- en 3-knopen toegelaten zijn. Toevoegen kan 

door het implementeren van een extra lus (voor rotaties) maar het is 

niet flexibel genoeg voor een goede top-down versie. 

45

Gebalanceerde Bomen

Create successful ePaper yourself

Delete template?

Save as template?