31.10.2015 Views

Handbuch Digital Humanities

DH-Handbuch

DH-Handbuch

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Strukturen erkennen im<br />

hochdimensionalen Raum: Die<br />

Principal Component Analysis<br />

Die PCA wurde erstmals von Karl Pearson 6 und Harold Hotelling<br />

7 beschrieben. Sie erlaubt es, in einem hochdimensionalen<br />

Datensatz eine Betrachtungsebene zu finden, in der sich<br />

möglichst viel von der Varianz der Daten visuell erfassen lässt.<br />

Abbildung 5.3: Vereinfachte Darstellung einer PCA auf nur<br />

zwei Dimensionen. Bei gleichzeitiger Betrachtung alle (zwei)<br />

Dimensionen sind hier deutlich zwei unterscheibare Gruppen<br />

zu erkennen. Reduziert auf eine einzige Dimension, X oder<br />

Y, zeigt sich in den Daten aber keine bimodale Verteilung;<br />

die Gruppen lassen sich nicht mehr unterscheiden. Ebenso<br />

kann es in einem Datensatz mit 100 oder mehr Dimensionen<br />

schwierig werden, jene Dimensionen (oder Kombinationen<br />

von Dimensionen) auszumachen, in denen Unterschiede<br />

deutlich werden. Die Achsen der beiden Principal<br />

Components, die sich für diesen Datensatz berechnen lassen,<br />

sind hingegen an die Varianzverteilung der Datenpunkte<br />

angepasst. Aus DARIAH-DE Report 5.2.3: Stand der<br />

Forschung in der Textanalyse.<br />

92

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!