18.09.2013 Aufrufe

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

Sprachliche Mensch-Maschine-Kommunikation

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

16.5 Glättung und Interpolation 273<br />

Die Summe der Wahrscheinlichkeiten aller n-Gramme muß für jedes n<br />

exakt 1 ergeben. Dies ist bei einer Maximum-Likelihood Schätzung schon für<br />

die ” gesehenen“ n-Gramme der Fall. Ordnen wir den ” nicht gesehenen“ auch<br />

Wahrscheinlichkeiten > 0 zu, so ist die geforderte Bedingung von Gl. 16.17<br />

nicht erfüllt. Um auch für die Rückfallwahrscheinlichkeiten etwas Wahrscheinlichkeitsmasse<br />

übrig zu haben, muß diese zuvor aus den n-Grammen<br />

mittels Discounting herausgenommen werden. Am häufigsten wird dafür ein<br />

absolutes Discounting gemäß Gl. 16.14 mit d ≈ 0.5 verwendet.<br />

Dann berechnet sich die Wahrscheinlichkeit für die gesehene Wortfolge<br />

w k−(n−1), . . . wk−2, wk−1, wk zu<br />

p+(wk|wk−1, wk−2, . . . w k−(n−1)) = #(w k−(n−1), w k−(n−2), . . . wk) − d<br />

#(w k−(n−1), w k−(n−2), . . . wk−1) (16.18)<br />

Für den Fall, daß w k−(n−1), . . .wk−2, wk−1, wk nicht gesehen wurde:<br />

p−(wk|wk−1, wk−2, . . . w k−(n−1))<br />

= p+(wk|wk−1, wk−2, . . . w k−(n−2)) · b(w1, w2, . . . wk−1) (16.19)<br />

wobei das ” Korrektiv“ b(w1, w2), der Backoff-Faktor, berechnet wird als:<br />

b(w1, w2, . . . wk−1) =<br />

<br />

w∈Vokabular<br />

d · δ(w1, w2, . . .wk−1, w)<br />

#(w1, w2, . . . wk−1)<br />

(16.20)<br />

wobei δ(w1, w2, . . .wk−1, w) entweder 1 ist (wenn w1, w2, . . .wk−1, w<br />

gesehen wurde) oder 0 ist (wenn es nicht gesehen wurde). Hat die<br />

Wortfolge w1, w2, . . . wk−1) in den Trainingsdaten sehr viele verschiedene<br />

Nachfolgewörter ist die Wahrscheinlichkeit für einen ” nicht gesehenen“<br />

Wortübergang größer als wenn sie nur wenige verschiedene Nachfolger hat.<br />

Das Rückfallen auf eine niedrigere n-Gramm-Stufe kann durchaus auch<br />

kaskadiert nötig sein. Wenn in Gl. 16.19 p+(wk|wk−1, wk−2, . . . w k−(n−2))<br />

nicht bekannt ist, weil auch die kürzere Wortfolge w k−(n−2), . . .wk nicht<br />

gesehen wurde, so muß auch hier mit Hilfe der Backoff-Methode auf<br />

p−(wk|wk−1, wk−2, . . . w k−(n−2)) zurückgefallen werden, so daß im allgemeinen<br />

eine Berechnung des n-Gramms wie folgt aussieht:

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!