13.07.2015 Aufrufe

INSTITUTFÜRINFORMATIK - Lehrstuhl für Effiziente Algorithmen ...

INSTITUTFÜRINFORMATIK - Lehrstuhl für Effiziente Algorithmen ...

INSTITUTFÜRINFORMATIK - Lehrstuhl für Effiziente Algorithmen ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

2.2. Datenströme 252.2.1 Verarbeitungsmodelle und KomplexitätsmaßeEs sei Σ = {a 1 ,...,a n } ein Alphabet der Größe n. (WirbetrachtenaberauchunbeschränkteAlphabete.)Ein Datenstrom s ist eine endliche Folge s =(s 1 ,...,s i ,...,s N )mits i ∈ Σ.Interpretation eines Verarbeitungsmodells für Datenströme:In einem Datenstrom s wird jedes Element s i nur einmal gelesen und zwar in aufsteigenderReihenfolge der Indizes (sequenzieller Zugriff).Ein Beispiel für eine Datenstromverarbeitung liegt bei Back-Ups, die auf Bändern hinterlegtsind, vor.Komplexitätsmaße in solchen Verarbeitungsmodellen:• Anzahl der Pässe: ”Wie oft liest ein Algorithmus den Datenstrom?“• Speicherplatz (als Funktion von n, N)• Verarbeitungszeit pro DatenstromelementCharakteristik guter <strong>Algorithmen</strong> auf Datenströmen:• möglichst ein Pass (oder nur sehr wenige)• sublinearer Speicherplatz (möglichst logarithmisch)• O(1) amortisierte Verarbeitungszeit pro Datenstromelement (d.h. insgesamt lineareVerarbeitungszeit)Beispiel. Für feste Suchwörter sind sowohl der Algorithmus von Knuth, Morris und Pratt also der Algorithmusvon Aho und Corasick gute Datenstromalgorithmen (ein Pass, konstanter Speicherplatz, lineareVerarbeitungszeit). Der Algorithmus von Boyer und Moore benötigt Ω(N) Pässe im schlechtesten Fall.2.2.2 Ein-Pass-<strong>Algorithmen</strong> zur Hot-List-AnalyseUnter der Hot-List-Analyse verstehen wir das folgende Auswertungsproblem: Gegeben seiein Datenstrom s =(s 1 ,...,s N ) über einem Alphabet Σ mit ‖Σ‖ = n. Bestimme dieElemente in s, diemitHäufigkeit ϑ vorkommen, d.h. gebe die MengeH(s, ϑ) = def { a ∈ Σ ||s| a >ϑ· N }aus, wobei ϑ ∈ [0, 1) eine reelle Zahl und |s| a die Anzahl der Vorkommen von a in s ist.Version 0.6 Fassung vom 16. Februar 2007

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!