Handbuch Digital Humanities

More documents

Recommendations

Info

Strukturen erkennen im hochdimensionalen Raum: Die Principal Component Analysis Die PCA wurde erstmals von Karl Pearson 6 und Harold Hotelling 7 beschrieben. Sie erlaubt es, in einem hochdimensionalen Datensatz eine Betrachtungsebene zu finden, in der sich möglichst viel von der Varianz der Daten visuell erfassen lässt. Abbildung 5.3: Vereinfachte Darstellung einer PCA auf nur zwei Dimensionen. Bei gleichzeitiger Betrachtung alle (zwei) Dimensionen sind hier deutlich zwei unterscheibare Gruppen zu erkennen. Reduziert auf eine einzige Dimension, X oder Y, zeigt sich in den Daten aber keine bimodale Verteilung; die Gruppen lassen sich nicht mehr unterscheiden. Ebenso kann es in einem Datensatz mit 100 oder mehr Dimensionen schwierig werden, jene Dimensionen (oder Kombinationen von Dimensionen) auszumachen, in denen Unterschiede deutlich werden. Die Achsen der beiden Principal Components, die sich für diesen Datensatz berechnen lassen, sind hingegen an die Varianzverteilung der Datenpunkte angepasst. Aus DARIAH-DE Report 5.2.3: Stand der Forschung in der Textanalyse. 92
Die erste Achse dieses neuen Bezugsystems (PC1) führt exakt durch die Datenpunkte in Richtung ihrer größten Ausdehnung, sie beschreibt also die größte Varianz der Daten. Die weiteren Achsen (PC2 bis PCn) repräsentieren andere neue, orthogonal zur PC1 verlaufenden Achsen in Reihenfolge der Varianz, die der Datensatz in diesen Dimensionen jeweils hat (Abb. 5.3). Folglich kann diese Technik eingesetzt werden, um aus einem Datensatz mit beliebig vielen Dimensionen eine zweidimensionale Darstellung (mit PC1 und PC2 als X- bzw. Y-Achse) zu erzeugen, die exakt diejenige Betrachtungsebene zeigt, in der der größte Teil der Datenvarianz zu sehen ist und oftmals auch die Unterschiede zwischen Gruppen von Punkten am besten herausgestellt werden (Abb. 5.4). Abbildung 5.4: Entlang der neu berechneten Achse PC1 verläuft die Dichtekurve bimodal. Nun wird der Unterschied zwischen den beiden Gruppen schon in einer einzigen Dimension sichtbar. Aus DARIAH-DE Report 5.2.3: Stand der Forschung in der Textanalyse. Dieses rechnerisch aufwendige Verfahren fand mit Aufkommen des Computers zunehmend mehr Berücksichtigung in unterschiedlichen Bereichen wie beispielsweise der Biologie, der Meterologie oder bei Bildkompressionsverfahren. 93
Page 1 and 2:
DARIAH-DE Handbuch Digital Humaniti
Page 3 and 4:
Inhaltsverzeichnis 1 1.1 1.2 1.3 1.
Page 5 and 6:
6 6.1 6.2 6.2.1 6.2.2 6.2.3 6.2.4 6
Page 7 and 8:
Was sind die Digital Humanities? Be
Page 9 and 10:
Ein Beispiel für eine Methode der
Page 11 and 12:
Weitere Forschungsfragen, die mit M
Page 13 and 14:
Folgende Personen sind mit Intervie
Page 15 and 16:
Digital Humanities in der Praxis Um
Page 17 and 18:
Welche Tools haben Sie ausgewählt
Page 19 and 20:
essere Nutzerführung, andererseits
Page 21 and 22:
Allerdings bleibt zweierlei zu kons
Page 23 and 24:
europäischen und nord- sowie süda
Page 25 and 26:
Projekte, die große Datenmengen an
Page 27 and 28:
gesteuert über ein Suchinterface a
Page 29 and 30:
Bau- und Kunstgeschichte • Durch
Page 31 and 32:
diese Weise kann der Lageplan belie
Page 33 and 34:
grundlegende Überlegungen zur kogn
Page 35 and 36:
Masato Takami, Peter Bell and Björ
Page 37 and 38:
- vielleicht so wie für uns die Bi
Page 39 and 40:
Weitere Informationen zu den Projek
Page 41 and 42: mitarbeiter an der Entwicklung des
Page 43 and 44: Hannah Busch: Handschriften analysi
Page 45 and 46: Warum wurden digitale Methoden gew
Page 47 and 48: Weitere Links: http://www.ecodicolo
Page 49 and 50: ARIADNE „Advanced Research Infras
Page 51 and 52: Vom Datenberg zum Wissensfluss: Wie
Page 53 and 54: Andorfer 5 zeigt im Zuge der Auswer
Page 55 and 56: die maßgeblich zu Standardisierung
Page 57 and 58: Kontrollierte Vokabulare Viel Aufme
Page 59 and 60: Dateiformate Die Welt der Dateiform
Page 61 and 62: Eine Übersicht über relevante Dat
Page 63 and 64: und damit auch Darstellungsfehlern
Page 65 and 66: aktuell ist, so sollte diese Datei
Page 67 and 68: So können Links und Verweise in ei
Page 69 and 70: wertvolle Empfehlungen geben. 29 Du
Page 71 and 72: http://www.europeana.eu http://www.
Page 73 and 74: 15 Für weitere Informationen: http
Page 75 and 76: mehr lizenzfrei. Für die Wissensch
Page 77 and 78: Neue Möglichkeiten durch alternati
Page 79 and 80: Creative Commons - Choose a License
Page 81 and 82: In Deutschland und vielen anderen L
Page 83 and 84: Rechtliche Bedingungen und Handlung
Page 85 and 86: Methoden und Werkzeuge in den Digit
Page 87 and 88: diese bewegt oder animiert, werden
Page 89 and 90: gabe der Daten ist sehr einfach geh
Page 91: tern, wie "und", "der" und "die". O
Page 95 and 96: Noch weiter lässt sich die Analyse
Page 97 and 98: Euklidische Distanz verwendet. Empi
Page 99 and 100: oder in einem Unixsystem "/home/Mei
Page 101 and 102: im Koordinatensystem einer Gruppe z
Page 103 and 104: ComputerlinguistInnen haben in den
Page 105 and 106: erledigen, hier bietet sich zusätz
Page 107 and 108: Abbildung 5.10: Baumdiagramm der St
Page 109 and 110: S. Bock, K. Du, P. Dürholt, T. Gra
Page 111 and 112: Forschungsinfrastrukturen nutzen Zi
Page 113 and 114: Lösungen entwickelt und bereitgest
Page 115 and 116: manities "on demand" und flexibel e
Page 117 and 118: • Größe (von einigen wenigen Ki
Page 119 and 120: festgelegt werden, die unterschiedl
Page 121 and 122: Sichere Dienste und Daten Eine Auth
Page 123 and 124: Das Monitoring ermöglicht die Übe
Page 125 and 126: enannt und es wird evaluiert, ob ei
Page 127 and 128: 12 Danah Tonne, Jedrzej Rybicki, St
Page 129 and 130: Technische Nachhaltigkeit Auf der e
Page 131: Was bieten die Digital Humanities?
show all

Handbuch Digital Humanities

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?