13.07.2015 Aufrufe

INSTITUTFÜRINFORMATIK - Lehrstuhl für Effiziente Algorithmen ...

INSTITUTFÜRINFORMATIK - Lehrstuhl für Effiziente Algorithmen ...

INSTITUTFÜRINFORMATIK - Lehrstuhl für Effiziente Algorithmen ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

2.2. Datenströme 35Damit ist für m 1 ≥ c · k·n1− 1 kδ 2 die Fehlerwahrscheinlichkeit höchstens 1 c .Theorem 2.31 Werden für k ≥ 1, δ > 0 und ε > 0 die Parameter m 1 und m 2 imAlgorithm SampleCount (siehe Abbildung 2.11) alsm 1 =8· k · n1− 1 ( )k1δ 2 und m 2 =2· logεgesetzt, so berechnet SampleCount für einen Datenstrom s mit bekannter Länge N (überΣ={a 1 ,...,a n })einenWertY , der von F k (s) mit Wahrscheinlichkeit höchstens ε ummehr als δF ˙ k (s) abweicht, und benötigt dafür(k 2 log ( ))1εOδ 2 · n 1− 1 k · (log N +logn)Speicherplatz.Beweis: Die Aussagen des Theorems sind klar bis auf die Wahrscheinlichkeitsaussage.Diese folgt aus Fehlerabschätzungen für den Median von {Y [1],...,Y[m 2 ]} mit Hilfe vonChernoff-Schranken (ohne Beweis).Betrachten wir nun den Fall, dass uns die Datenstromlänge N nicht bekannt ist. Wiepassen wir dann SampleCount an? Zwei Aspekte müssen wir dabei beachten:1. Jedes neu gelesene Datenstromelement könnte das letzte Element sein.2. Alle Positionen im Datenstrom, ab denen wir die Vorkommen von Elementen zählen,müssen mit gleicher Wahrscheinlichkeit gewählt werden können. Diese sinkt jedochmit zunehmender Datenstromlänge.Der in Abbildung 2.12 beschrieben Algorithmus von Alon, Matias und Szegedy gibt eineLösung für diese Probleme an.Korollar 2.32 Der Algorithmus von Alon, Matias und Szegedy berechnet das MomentF k (s) für einen Datenstrom s =(s 1 ,...,s N ), ohne die Gesamtlänge zu kennen, mit dengleichen Fehler- und Platzschranken wie der Algorithmus SampleCount.Beweis: Die Übertragung der Platzschranken ist klar. Die Fehlerschranken übertragensich, falls die Wahrscheinlichkeit dafür, dass eine Position p als Beginn für die Zählung imArray R gewählt wird (Zeilen 11–13) gerade 1 Nist. Dies ist jedoch wie folgt einzusehen:1. Die Wahrscheinlichkeit, dass s p neu gewählt wird, ist 1 pL = p).(dies geschieht nur im FalleVersion 0.6 Fassung vom 16. Februar 2007

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!