13.07.2015 Aufrufe

INSTITUTFÜRINFORMATIK - Lehrstuhl für Effiziente Algorithmen ...

INSTITUTFÜRINFORMATIK - Lehrstuhl für Effiziente Algorithmen ...

INSTITUTFÜRINFORMATIK - Lehrstuhl für Effiziente Algorithmen ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

32 Kapitel 2. DatenanalyseAlgorithmus: SampleCountEingabe: Parameter N, Datenstroms =(s 1 ,...,s N ) über Σ = {a 1 ,...,a n }Ausgabe: (Schätzung für das) Moment F k (s)1. Parameter m 1 und m 2 geeignet initialisieren2. FOR i := 1 TO m 23. FOR j := 1 TO m 14. RANDOM p IN {1,...,N}5. r := 06. a := s p7. FOR q := p TO N8. IF s q = a9. r := r +110. X[i, j] :=N · (r k − (r − 1) k )11. FOR j := 1 TO m 112. Y [i] :=Y [i]+ 1 m 1· X[i, j]13. Gebe den Median von {Y [1],...,Y[m 2 ]} ausAbbildung 2.11: Der Algorithmus SampleCountWie sind nun aber m 1 und m 2 zu wählen, damit sowohl Platzbedarf als auch Fehlerwahrscheinlichkeitklein gehalten werden können?Proposition 2.27 Für jeden Datenstrom s =(s 1 ,s 2 ,...,s N ) sind die ZufallsvariablenX[i, j] aus Zeile 10 des Algorithmus SampleCount für alle 1 ≤ i ≤ m 2 und 1 ≤ j ≤ m 1unabhängig und identisch verteilt. Außerdem gilt IEX[i, j] =F k (s).Beweis: Unabhängigkeit und identische Verteilung der Variablen X[i, j] ist offensichtlich.Wir berechnen nun den Erwartungswert von X = X[i, j] wie folgt:IEX = 1 N ·= 1 N ·=N∑i=1N ·(|(s i ,...,s N )| k s i− (|(s i ,...,s N )| si − 1) k)|s| n∑ ∑ aiN · (j k − (j − 1) k )i=1 j=1n∑|s| k a ii=1= F k (s)Dies beweist die Aussagen der Proposition.Lemma 2.28 Es sei X die Zufallsvariable, die von SampleCount in Zeile 10 für denDatenstrom s berechnet wird. Dann gilt IEX 2 ≤ k · F 1 (s) · F 2k−1 (s).Skriptum zu Internet-Algorithmik WS 2006/2007

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!