08.10.2013 Aufrufe

Inkrementelle Thesauri am Beispiel von Spam- und ... - Wiki of UNI.LU

Inkrementelle Thesauri am Beispiel von Spam- und ... - Wiki of UNI.LU

Inkrementelle Thesauri am Beispiel von Spam- und ... - Wiki of UNI.LU

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

<strong>Inkrementelle</strong>r Thesaurus für Sp<strong>am</strong><br />

• Unser Plan war:<br />

• Daten vorbereiten (zuerst nur subject lines<br />

abarbeiten) – manuell <strong>und</strong> automatisch<br />

• Manuell:<br />

• Besondere Schreibweisen <strong>von</strong> Wörtern entdecken<br />

• Eine Liste mit wichtigen Stichwörtern aus den nicht<br />

pharmazeutischen Bereichen zus<strong>am</strong>menstellen<br />

• Automatisch:<br />

• Subject lines vom Rest trennen<br />

• Mit regulären Ausdrücken Spellingvariationen beschreiben<br />

• Statistische Analyse der Daten<br />

• <strong>Inkrementelle</strong> Version entwerfen<br />

7 <strong>Inkrementelle</strong> <strong>Thesauri</strong> <strong>am</strong> <strong>Beispiel</strong> <strong>von</strong> Sp<strong>am</strong>- <strong>und</strong> Phishing-Mails TRM - SS2006

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!