13SS_6b_PG1_Algorithmen_Datenstrukturen_Suchen_Sortieren_Stud_01_21.pdf

FB Informatik 

Prof. Dr. R.Nitsch 

Algorithmen und Datenstrukturen (Beispiele in C++) 

Reiner Nitsch 

8471 

reiner.nitsch@h-da.de

Such-Algorithmen – Lineare Suche 

Prinzip der linearen Suche: 

‣Betrachte jedes Element im Suchbereich 

‣Vergleiche jedes Element im Suchbereich mit dem Suchwert 

‣Wenn gefunden (Suchtreffer), gib Index oder Zeiger auf Suchtreffer zurück 

‣Wenn nicht gefunden (Suchfehler), gib Sentinel zurück. 

FB Informatik 


int* find( int* pfirst, int* plast, int val ) { 

while( pfirst

Such-Algorithmen – Binäre Suche 

FB Informatik 


Nachteil der linearen Suche: langsam, weil Suche in kleinen Schritten 

Besser: Suche in großen Schritten 

Frage: Wie errät man eine Zufalls-Zahl zwischen 0 und 100 am schnellsten? 

2. Version des Suchalgorithmus: Binäre Suche 

Algorithmischer Kern 

Rateversuch: Mittlere Zahl aus (sortiertem) Suchbereichs 

wenn gleich: fertig 

sonst: links oder rechts weitersuchen 

int* binarySearchI( int* pfirst, int* plast, int val ) { 

//Binäre Suche (iterativ) im Bereich [pfirst, plast); 

// Vorbedingung: sortierte Elemente in Bezug auf operator< 

} 

int* pend = plast; 

while (pfirst

Aufwand von Algorithmen (Komplexität) 

FB Informatik 


Kriterien sind u.a. 

Speicheraufwand 

‣ für Programm/Algorithmus 

‣ für Daten 

Zeitaufwand 

‣ für Aufruf und Initialisierungen 

‣ für Wiederholungen 

statisch 

dynamisch, d.h. abhängig von Datenmenge 

statisch 

dynamisch 

Speicherkomplexität 

Zeitkomplexität 

Eine präzise detailreiche Bestimmung der Aufwände wird i.A nicht durchgeführt, weil dies 

‣ mathematisch oft nicht handhabbar ist 

‣ uninteressant ist: für Vergleichszwecke reicht auch ger. Detailierungsgrad 

Vereinfachungen (Abstraktionen) bei der Ermittlung des Zeitaufwandes 

Der tatsächliche Zeitaufwand ist immer prozessorabhängig. 

Um davon unabhängig zu werden, macht man folgende Vereinfachungen: 

‣ Jede Anweisung (Schleifen ausgenommen) benötigt den Zeitaufwand 1 

‣ Bei Wiederholungen/Schleifen sind wiederholten Anweisungen mit der Anzahl der Wiederholungen zu 

gewichten, die meist von der Anzahl n der Eingabedaten bestimmt ist. 

20.06.2013 5

Aufwand von Algorithmen - Abstraktionen 

FB Informatik 


Wenn die Algorithmuslaufzeit T(n) nicht für alle Eingaben derselben Länge n gleich 

ist, sind folgende Grenzfälle interessant: 

der beste Fall (best case) T best 

der schlimmste Fall (worst case) T worst 

das Durchschnittsverhalten (average case) T avg 

O-Notation (auch Landau-Notation) der Laufzeitfunktion 

ist ein mathematisches Verfahren zur Einordnung der Komplexität von Funktionen für 

großes n. 

benennt lediglich aus einer Klasse gleich schnell wachsender Funktionen den einfachsten 

Repräsentanten als obere Schranke (Supremum). Meist reicht diese Abschätzung der 

Größenordnung, weil Algorithmen sich schon hier unterscheiden. 

gibt ein Maß für die Anzahl der Elementarschritte in Abhängigkeit von der Anzahl n der 

Eingabedaten an. 


Such-Algorithmen – Binäre Suche 

FB Informatik 


1 

1 

1 

1 

1 

Lineare Suche 

1 

1 

int* find( int* pfirst, int* plast, int val ) { 

while( pfirst

Komplexität der binären Suche 

FB Informatik 


Aufwandsabschätzung für binäre Suche 

• Jede Iteration benötigt die Zeit 3 

• Jede Iteration halbiert den Suchbereich 

Nach dem 1. Halbieren enthält Suchbereich noch n/2 = n/2 1 Elemente 

Nach dem 2. Halbieren enthält Suchbereich noch n/4 = n/2 2 Elemente 

… 

Nach dem R-ten Halbieren enthält Suchbereich noch n/2 R Elemente 

• Worst case: Suche endet, wenn Suchbereich nur noch 1 Element enthält! 

n 

2 R = 1 R = log 2(n) Wiederholungen Zeitkomplexität T(n) = R(n)·3+2= log 2 (n) · 3 + 2 

d.h. die Zeitkomplexität wächst logarithmisch mit n 

Dies bringt man abkürzend durch die "Big-O"-Notation zum Ausdruck: Zeitkomplexität = O( log n ) 

Ergebnis: In sortierten Reihen kann wesentlich schneller gesucht werden! 

Beispiel: Laufzeitvergleich 

lineare ↔ binäre Suche 

(gemessene Werte: 

Intel X86 Prozessor, 1,66 GHz, 

Debug-Konfiguration) 

n O(n) O(log n) 

1000 2,6 us 0,1 us = 0,033 us • 3 

10 6 2,6 ms 0,2 us = 0,033 us • 6 

10 9 2,6 s 0,3 us = 0,033 us • 9 


Beispiele zur Schätzung der Zeitkomplexität 

FB Informatik 


Laufzeit 

Anweisung Zeitkomplexität T(n) Big-O Typische Algorithmen 

x=x+1; 

for (int i=1; i

Weitere Beispiele für O-Notation der Algorithmuslaufzeit 

FB Informatik 


Notation Bedeutung Anschauliche Erklärung Beispiele für Laufzeiten 

T(n) є O(1) 

ist konstant 

überschreitet einen konstanten Wert nicht 

(unabhängig vom Wert des Arguments). 

Nachschlagen des x-ten Elementes in einem 

Feld. 

T(n) є O(log n) 

wächst 

logarithmisch 

wächst ca. um einen konstanten Betrag, 

wenn sich das Argument verzehnfacht. 

Binäre Suche im sortierten Feld mit n 

Einträgen 

T(n) є O(√n) 

wächst wie die 

Wurzelfunktion 

wächst ungefähr auf das Doppelte, wenn 

sich das Argument vervierfacht 

naiver Primzahltest mittels Teilen durch 

jede Zahl ≤n 

T(n) є O(n) 

wächst linear 


sich das Argument verdoppelt. 

Suche im unsortierten Feld mit Einträgen 

(Bsp. Lineare Suche) 

T(n) є O(nlog n) 

hat super-lineares 

Wachstum 

Fortgeschrittenere Algorithmen zum 

Sortieren von Zahlen Mergesort, Heapsort 

T(n) є O(n 2 ) 

wächst 

quadratisch 

wächst ungefähr auf das Vierfache, wenn 

sich das Argument verdoppelt 

Einfache Algorithmen zum Sortieren von 

Zahlen Selectionsort 

T(n) є O(n k ) 

wächst 

polynomiell 


sich das Argument um eins erhöht 

Zahlenschloßprojekt T(n)=O(n 3 ) 

T(n) є O(n!) 

wächst faktoriell 

wächst ungefähr um das n-fache, wenn 

sich das Argument um eins erhöht. 

Problem des Handlungsreisenden 


Warum ist die Zeitkomplexität eines Algorithmus so wichtig? 

FB Informatik 


Häufig ist die erste Idee, die HW zu beschleunigen. 

Aber: der Geschwindigkeitsvorteil ist dabei auf konstanten Faktor beschränkt 

Bessere HW ist zudem teuer, bzw. stößt an technische Grenzen 

Ein schneller Algorithmus auf einer langsamen Maschine wird immer schneller 

sein als ein langsamer Algorithmus auf einer schnellen Maschine! 

Supercomputers are for people too rich and 

too stupid to design efficient algorithms 

(Steven Skiena) 


Sortieren 

FB Informatik 


Für ein Feld von n Objekten gibt es n! Permutationen 

Sortieren ist ein Vorgang, der durch (möglichst wenige) paarweise Vergleiche von 

Objekten eine dieser Permutationen herausfiltert, in der die Objekte einer 

bestimmten Ordnungsrelation (z.B. größer, kleiner, …) genügen. 

Stabile Sortierung 

Beispiel: 

7 

2 

2 

3 

5 

5 

3 

7 

unsortiert sortiert 

Kommt ein Schlüsselwert 

mehrfach vor (Duplikate) ist 

die Sortierung nicht eindeutig: 

Ein Sortierverfahren, bei dem die 

Reihenfolge von Schlüsselduplikaten 

nach dem Sortieren unverändert ist, 

bezeichnet man als 

"Stabiles Sortierverfahren" 

1 

3 

3 

7 

7 

3 

1 

3 

1 

3 

3 

7 

sortiert unsortiert stabil sortiert 

Schlüsselwerte 


Sortierverfahren - Klassifizierungskriterien 

FB Informatik 


Zeitverbrauch 

‣ Anzahl Schlüsselvergleiche 

‣ Anzahl Vertauschungen 

‣ Sensibilität bezüglich Eingabeverteilung 


Speicherplatzverbrauch (Programme u. Daten) 

Speicherkomplexität 

‣ Speicherplatzbedarf am geringsten für Sortieren am Ort ("in place" oder "in situ") 

Stabile Sortierverfahren, ändern die Reihenfolge von Duplikaten beim Sortieren nicht. 

Wie schnell kann man sortieren? 

Voraussetzung für jedes Sortieren: Auf den zu sortierenden Objekten muss eine Ordnung für 

die Schlüsselwerte definiert sein. 

Untere Komplexitätsschranke für Sortierverfahren: 

Satz: Jedes vergleichsbasierte Sortierverfahren für N Elemente benötigt im 

Mittel und im schlechtesten Fall eine Laufzeit von wenigstens 

T(N)O(N·log N) Vergleiche 


Sortierverfahren - Klassifizierung von Sortiertechniken 

FB Informatik 


Sortieren durch 

L1 

Min. Element von L2 

1) Auswählen 

2) Einfügen 

sortiert 

sortiert 

3) Austauschen Elementare Sortierverfahren 

4) Zerlegen 

K i >K 

K 

K j

Sortieren durch Austauschen (exchange sort, bubble sort) 

FB Informatik 


Austauschen 

lokal 

Idee: 

Beginnend am Anfang der unsortierten 

Teilreihe werden jeweils Elementpaare 

gebildet. 

Die Elemente eines Paares werden 

verglichen und dann getauscht, wenn das 

größere Element näher am Anfang der 

Reihe liegt. 

Nach N-1 Schritten ist der 1. Sortierlauf 

beendet und das größte Element zum Ende 

der Reihe wie eine Blase "aufgestiegen" ( 

Bubble Sort). Es bildet dort das 1. Element 

der teilsortierten Reihe. 

Der Vorgang wird mit der um ein Element 

kleineren unsortierten Teilreihe wiederholt. 

Nach N-1 solchen Sortierläufen ist der 

Sortiervorgang abgeschlossen. 

first 420 97 97 97 97 

97 420 420 420 420 

420 420 420 301 301 

301 301 301 420 35 

35 35 35 35 420 

last … … … … … 

teilsortierte Reihe unsortierte Reihe 

first 97 97 97 97 

420 420 301 301 

301 301 420 35 

35 35 35 420 

420 420 420 420 

last … … … … 

Ist der Sortiervorgang stabil? 

ja 


Implementierung von Bubble-Sort 

FB Informatik 


/* BubbleSort - Sorts a subsequence [pfirst,plast) 

@param pfirst pointer to first element of subsequence 

@param plast pointer to one-past-the-end element of the subsequence */ 

// version 1 (with pointer) 

void bubbleSort( int* pfirst, int* plast ) { 

} 

for ( int* plastu=plast-1; plastu>pfirst; --plastu ) 

for ( int* pp=pfirst ; pp

Aufwandsabschätzung für Bubble-Sort 

FB Informatik 



 

 

AnzVgl . N 1 ( N 2) ... 1 

12 ... ( N 1) 

 

N 1 

k 1 

N N 2 

N N 

( 1) 

 

2 2 2 

 

2 

N N 

Anzahl Vertauschungen 

4 4 

 

 

 

 

 

Im Mittel halb so viele wie Vergleiche. 

Zusammenfassung 

k 

first 97 97 97 97 

teilsortierte Reihe 

in-place 

stabil 

Vertauschungen: O(N 2 ) im Mittel und im worst case; keine im best case. 

Vergleiche (Ver.2): O(N 2 ) im Mittel und im worst case; O(N) im best case. 

Aufwand (Anzahl Vergleiche) ist unabhängig von Eingabeverteilung. 

Wird in der Praxis kaum eingesetzt. 



35 35 35 420 

420 420 420 420 

last … … … … 

unsortierte Reihe 

first 97 97 97 97 



35 35 35 420 

420 420 420 420 

last … … … … 


Sortieren durch Auswahl (selection sort, MinSort, ExchangeSort) 

FB Informatik 


Idee: 

Auswahl des kleinsten Elementes im 

unsortierten Teil (L2) der Reihe 

Austausch mit dem ersten Element der 

unsortierten Teilreihe 

Die teilsortierte Reihe (L1) ist danach 

um 1 Element gewachsen. Die 

unsortierte Reihe enthält 1 Element 

weniger. 

Nach N solchen Durchläufen ist die 

Reihe sortiert. 

first 420 35 35 35 35 

420 420 97 97 97 

97 97 420 301 301 

301 301 301 420 420 

35 420 420 420 420 

last … … … … … 


Auswählen 

L1 Min. Element von L2 

first 

firstu 

min 

last 

Ist der Sortiervorgang stabil? 

Beispiel: s. Abb. ( Key 420 ) 


Sortieren durch Auswahl - Komplexität und Eigenschaften 

FB Informatik 


// Algorithmus in Pseudocode 

prozedur selectionSort( a, first, last ) 

[ a[first], a[last] ) : Bereich sortierbarer Elemente 

Variable: firstu:=first Position d. 1. Elem. der unsort. Reihe 

wiederhole 

Variable: min:= firstu 

für jede Position pos von firstu+1 bis last-1 wiederhole 

falls a[pos]

Sortieren durch Einfügen (insertion sort) 

FB Informatik 


Idee: Vorgehen wie beim Sortieren eines 

Kartenspiels. 

1. Starte mit oberster Karte den sortierten 

Stapel 

2. Nimm die jeweils nächste Karte vom 

unsort. Stapel 

3. Füge sie an der richtigen Stelle im 

sortierten Stapel ein 

In einem Array müssen die größeren 

Elemente um 1 Indexposition weiter 

rücken, um dem kleineren Einfügeelement 

Platz zu machen. 

Mit jedem Einfügeschritt wird der 

sortierte Stapel um 1 ein Element größer. 

Nach N-1 solchen Einfügeschritten ist der 

Sortiervorgang abgeschlossen. 

first 420 97 97 35 35 

97 420 420 97 97 

420 420 420 420 301 

35 35 35 420 420 

301 301 301 301 420 

last … … … … … 

teilsortierte Reihe 

unsortierte Reihe 

prozedur insertionSort( a, first, last ) 

[ a[first], a[last] ) : Bereich sortierbarer Elemente 

pos: mögliche Einfügeposition 

posC: Position des nächsten Einfügekandidaten 

valC: Wert des nächsten Einfügekandidaten 

für jedes Element von posC=first+1 bis last-1 wiederhole 

pos = posC 

6 5 4 3 2 1 valC 

valC := a[posC] 

solange first

Sortieren durch Einfügen - Komplexität und Eigenschaften 

FB Informatik 


Worst Case bei invers sortierter Reihe 

Max. Anzahl der Vergleiche: 

12 ... ( N 1) 

 

( 1) 

 

2 2 2 

2 

N N N N 

N 1 

 

k 1 

Max. Anzahl der Verschiebungen: 

12 ... ( N 1) N( N 1)/ 2 

k 

first 420 97 97 35 35 

97 420 420 97 97 

420 420 420 420 301 

35 35 35 420 420 

301 301 301 301 420 

last … … … … … 


Best Case bei sortierter Reihe 

Min. Anzahl der Vergleiche: 1 1 ... 1N 

1 

Min. Anzahl der Verschiebungen: 

0 

Vorteilhaft bei fast sortierten Reihen: 

In-place-Verfahren, stabil

13SS_6b_PG1_Algorithmen_Datenstrukturen_Suchen_Sortieren_Stud_01_21.pdf

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?