Inkrementelle Thesauri am Beispiel von Spam- und ... - Wiki of UNI.LU
Inkrementelle Thesauri am Beispiel von Spam- und ... - Wiki of UNI.LU
Inkrementelle Thesauri am Beispiel von Spam- und ... - Wiki of UNI.LU
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Clusteranalyse<br />
• Für alle Termpaare (T k, T j) <strong>und</strong> (T j, T k) , die <strong>von</strong> Apriori<br />
bestimmt wurden, berechne die Clustergewichte CW:<br />
CW ( Tj,<br />
T<br />
k<br />
)<br />
n<br />
!<br />
!<br />
i=<br />
1<br />
dfj<br />
dij<br />
= ,<br />
dijk<br />
=<br />
N<br />
d<br />
!<br />
ijk<br />
= i=<br />
1<br />
n ; CW ( Tk,<br />
Tj)<br />
= i=<br />
1<br />
n<br />
d<br />
ij<br />
df<br />
N<br />
jk<br />
!<br />
dabei ist df j die Anzahl<br />
der Dokumente, in den<br />
Term j vorkommt (df jk für Paare)<br />
13 <strong>Inkrementelle</strong> <strong>Thesauri</strong> <strong>am</strong> <strong>Beispiel</strong> <strong>von</strong> Sp<strong>am</strong>- <strong>und</strong> Phishing-Mails TRM - SS2006<br />
n<br />
i=<br />
1<br />
d<br />
d<br />
ikj<br />
ik