Kurzfassung - Fakultät für Informatik, TU Wien
Kurzfassung - Fakultät für Informatik, TU Wien
Kurzfassung - Fakultät für Informatik, TU Wien
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
<strong>Kurzfassung</strong><br />
Name des Kandidaten: Harald Piringer<br />
Name der Prüfer: Eduard Gröller / Helwig Hauser<br />
Titel der Dissertation: Large Data Scalability in Interactive Visual Analysis<br />
English:<br />
In many areas of science and industry, the amount of data is growing fast and often already<br />
exceeds the ability to evaluate it. On the other hand, the unprecedented amount of available<br />
data bears an enormous potential for supporting decision-making. Turning data into<br />
comprehensible knowledge is thus a key challenge of the 21st century.<br />
The power of the human visual system makes visualization an appropriate method to<br />
comprehend large data. In particular interactive visualization enables a discourse between the<br />
human brain and the data that can transform a cognitive problem to a perceptual one.<br />
However, the visual analysis of large and complex datasets involves both visual and<br />
computational challenges. Visual limits involve perceptual and cognitive limitations of the<br />
user and restrictions of the display devices while computational limits are related to the<br />
computational complexity of the involved algorithms.<br />
The goal of this thesis is to advance the state of the art in visual analysis with respect to the<br />
scalability to large datasets. Due to the multifaceted nature of scalability, the contributions<br />
span a broad range to enhance computational scalability, to improve the visual scalability of<br />
selected visualization approaches, and to support an analysis of high-dimensional data.<br />
Concerning computational scalability, this thesis describes a generic architecture to facilitate<br />
the development of highly interactive visual analysis tools using multi-threading. The<br />
architecture builds on the separation of the main application thread and dedicated<br />
visualization threads, which can be cancelled early due to user interaction. A quantitative<br />
evaluation shows fast visual feedback during continuous interaction even for millions of<br />
entries.<br />
Two variants of scatterplots address the visual scalability of different types of data and tasks.<br />
For continuous data, a combination of 2D and 3D scatterplots intends to combine the<br />
advantages of 2D interaction and 3D visualization. Several extensions improve the depth<br />
perception in 3D and address the problem of unrecognizable point densities in both 2D and<br />
3D.<br />
For partly categorical data, the thesis contributes Hierarchical Difference Scatterplots to relate<br />
multiple hierarchy levels and to explicitly visualize differences between them in the context of<br />
the absolute position of pivoted values.<br />
While comparisons in Hierarchical Difference Scatterplots are only qualitative, this thesis also<br />
contributes an approach for quantifying subsets of the data by means of statistical moments<br />
for a potentially large number of dimensions. This approach has proven useful as an initial<br />
overview as well as for a quantitative comparison of local features like clusters.<br />
As an important application of visual analysis, the validation of regression models also<br />
involves the scalability to multi-dimensional data. This thesis describes a design study of an<br />
approach called HyperMoVal for this task. The key idea is to visually relate n-dimensional<br />
scalar functions to known validation data within a combined visualization. The integration<br />
with other multivariate views is a step towards a user-centric workflow for model building.<br />
- 1 -
Being the result of collaboration with experts in engine design, HyperMoVal demonstrates<br />
how visual analysis is suitable to significantly improve real-world tasks. Positive user<br />
feedback suggests a high impact of the contributions of this thesis also outside the<br />
visualization research community. Moreover, most contributions of this thesis have been<br />
combined in a commercially distributed software framework for engineering applications that<br />
will hopefully raise the awareness and promote the use of visual analysis in multiple<br />
application domains.<br />
Deutsch:<br />
In vielen Bereichen von Wissenschaft und Industrie wachsen die Datenmengen so rasch, dass<br />
sie oftmals nicht mehr ausgewertet werden können. Andererseits birgt die noch nie<br />
dagewesene Verfügbarkeit von Daten ein enormes Potential zur Unterstützung von<br />
Entscheidungsfindungen. Die datenbasierte Wissensgewinnung ist somit eine zentrale<br />
Herausforderung des 21. Jahrhunderts.<br />
Dank der Leistungsfähigkeit des menschlichen Sehapparates ist Visualisierung ein geeignetes<br />
Mittel um große Datenmengen zu verstehen. Speziell interaktive Visualisierungen<br />
ermöglichen einen Diskurs mit Daten, der es erlaubt, kognitive Aufgaben durch visuelle<br />
Wahrnehmung zu lösen. Allerdings umfasst die visuelle Analyse großer und komplexer Daten<br />
Herausforderungen sowohl was die Darstellung, als auch was die Berechnung angeht. Erstere<br />
betreffen perzeptuelle und kognitive Grenzen von Benutzern während letztere eng mit der<br />
Komplexität der eingesetzten Algorithmik zusammenhängen.<br />
Ziel dieser Dissertation ist die Erweiterung des Stands der Technik im Bereich visueller<br />
Analyse bezüglich der Skalierbarkeit <strong>für</strong> große Datenmengen. Entsprechend der vielen<br />
Facetten des Themas Skalierbarkeit spannen die Innovationen dieser Dissertation einen<br />
weiten Bogen von berechnungsbezogener Skalierbarkeit über die Verbesserung der visuellen<br />
Skalierbarkeit ausgewählter Visualisierungsansätze bis hin zur Unterstützung einer Analyse<br />
hochdimensionaler Daten.<br />
Hinsichtlich berechnungsbezogener Skalierbarkeit beschreibt diese Dissertation eine<br />
generische Architektur, um den Einsatz von Multithreading bei der Entwicklung interaktiver<br />
visueller Analysesysteme zu erleichtern. Kern der Architektur ist die Trennung des<br />
Hauptthreads der Applikation von speziellen Visualisierungsthreads sowie deren vorzeitigen<br />
Abbruch im Falle von Benutzerinteraktion. Eine quantitative Evaluierung belegt ein rasches<br />
visuelles Feedback während kontinuierlichen Interaktionen selbst bei Millionen von<br />
Datenwerten.<br />
Zwei Varianten von Punktdiagrammen widmen sich der visuellen Skalierbarkeit<br />
verschiedener Arten von Daten und Aufgaben. Im Falle kontinuierlicher Daten beabsichtigt<br />
eine Kombination aus 2D und 3D Punktdiagrammen die Vorteile zweidimensionaler<br />
Interaktion und dreidimensionaler Visualisierung miteinander zu kombinieren. Diverse<br />
Erweiterungen verbessern die Tiefenwahrnehmung in 3D und widmen sich dem Problem<br />
einer nicht erkennbaren Datendichte sowohl in 2D als auch in 3D. Für den Fall teilweiser<br />
kategorischer Daten beschreibt die Dissertation eine als hierarchische Differenz-<br />
Punktdiagramme (Hierarchical Difference Scatterplots) bezeichnete Technik. Zweck ist es,<br />
mehrere Hierarchiestufen miteinander in Bezug zu setzen und deren Unterschiede in Bezug<br />
auf diverse Aggregate explizit darzustellen.<br />
- 2 -
Während Vergleiche in hierarchischen Differenz-Punktdiagrammen nur qualitativer Natur<br />
sind, stellt diese Dissertation auch einen quantitativen Ansatz vor, der darauf beruht,<br />
statistische Momente von Teilmengen der Daten <strong>für</strong> potentiell viele Dimensionen gleichzeitig<br />
zu ermitteln. Anwendungen dieses Ansatzes umfassen sowohl einen Überblick über die<br />
Gesamtdaten als auch einen quantitativen Vergleich lokaler Charakteristika wie<br />
beispielsweise Cluster.<br />
Die Validierung von Regressionsmodellen ist eine wichtige Anwendung <strong>für</strong> eine visuelle<br />
Analyse, die eine Skalierung hinsichtlich höher dimensionaler Daten erfordert. Für diese<br />
Anwendung wird eine Designstudie eines als HyperMoVal bezeichneten Ansatzes<br />
beschrieben. Kernidee ist es, n-dimensionale Skalarfunktionen mit bekannten<br />
Validierungsdaten in einen gemeinsamen visuellen Bezug zu bringen. Die Integration mit<br />
anderen multivariaten Darstellungen stellt dabei einen Schritt in Richtung eines Benutzerbasierten<br />
Modellbildungsprozesses dar.<br />
Als Ergebnis einer Zusammenarbeit mit Experten im Bereich Motorenentwicklung zeigt<br />
HyperMoVal auch, dass visuelle Analyse geeignet ist, reale Aufgaben erheblich zu<br />
erleichtern. Positives Feedback seitens von Benutzern deutet die Bedeutung der Innovationen<br />
dieser Dissertation auch außerhalb der Forschungsgemeinde im Bereich Visualisierung an.<br />
Umso mehr, als die meisten Innovationen dieser Dissertation in einem gemeinsamen<br />
Softwareframework <strong>für</strong> Ingenieursanwendungen kommerziell vertriebenen werden. Es ist zu<br />
hoffen, dass dieses das Bewusstsein um die Möglichkeiten visueller Analyse und deren<br />
Anwendung in unterschiedlichen Bereichen steigern wird.<br />
- 3 -