13.07.2015 Aufrufe

INSTITUTFÜRINFORMATIK - Lehrstuhl für Effiziente Algorithmen ...

INSTITUTFÜRINFORMATIK - Lehrstuhl für Effiziente Algorithmen ...

INSTITUTFÜRINFORMATIK - Lehrstuhl für Effiziente Algorithmen ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

2.2. Datenströme 31• Mit Momenten lassen sich Erwartungswert, Varianz, Schiefe usw. bestimmen.Im Folgenden beschäftigen wir uns mit dem Problem, wie platzeffizient die Momenteberechnet werden können?Proposition 2.26 Für k ∈ IN kann F k (s) für einen Datenstrom s der Länge N übereinem Alphabet der Größe n lassen sich exakt mit O(n log N) Platz berechnet werden.Beweis: Benutze Binärzähler für jeden möglichen Buchstaben und berechne Ergebnis ausden Zählungen.Bemerkung. Für festes Alphabet (und variables k) ist dies Platzschranke optimal fürexakte Ein-Pass-<strong>Algorithmen</strong> (unter Verwendung der sogenannten Spurenmethode ausTheorem 2.21)2.2.5 Der Schätzalgorithmus von Alon, Matias und SzegedyDieser 1999 von Noga Alon, Yossi Matias und Mario Szegedy publizierte Algorthmus, derzusammen mit noch weiteren, sehr raffinierten Resultaten in der selben Arbeit 2005 mitdem renommierten Gödel-Preis ausgezeichnet worden ist, basiert auf der einfachen Ideeder Stichprobe (englisch sampling):Wir betrachten ein zufälliges Element s i in s =(s 1 ,...,s N ) und zählen die Vorkommenvon Elementen, die gleich s i sind, erst ab der Position i. An Hand dieser Anzahl geben wireine Schätzung für den gesamten Datenstrom ab. Für eine geeignete Fehlerkonzentrationmüssen jedoch mehrere Variablen verwendet werden.Zunächst setzen wir voraus, dass die Länge des Datenstroms bekannt ist. Eine Umsetzungdes eben beschriebenen Ansatzes ist im Algorithmus SampleCount aus Abbildung2.11 zu sehen. Zu beachten ist allerdings, dass diese Form keinem Ein-Pass-Algorithmusentspricht. Dies lässt sich aber leicht einrichten.Für den Platzbedarf von SampleCount in Abhängigkeit von m 1 und m 2 ergibt sich:• Berechnung von X[i, j] benötigt O(log N +logn) Platz• Darstellung von X[i, j] benötigt O(k log N) Platz• Es müssen m 1 · m 2 Variablen verwaltet werdenInsgesamt erfordert dies O(m 1 · m 2 · (k · log N +logn)) Platz.Version 0.6 Fassung vom 16. Februar 2007

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!