30.01.2014 Aufrufe

Kurzfassung - Fakultät für Informatik, TU Wien

Kurzfassung - Fakultät für Informatik, TU Wien

Kurzfassung - Fakultät für Informatik, TU Wien

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

<strong>Kurzfassung</strong><br />

Name des Kandidaten: Harald Piringer<br />

Name der Prüfer: Eduard Gröller / Helwig Hauser<br />

Titel der Dissertation: Large Data Scalability in Interactive Visual Analysis<br />

English:<br />

In many areas of science and industry, the amount of data is growing fast and often already<br />

exceeds the ability to evaluate it. On the other hand, the unprecedented amount of available<br />

data bears an enormous potential for supporting decision-making. Turning data into<br />

comprehensible knowledge is thus a key challenge of the 21st century.<br />

The power of the human visual system makes visualization an appropriate method to<br />

comprehend large data. In particular interactive visualization enables a discourse between the<br />

human brain and the data that can transform a cognitive problem to a perceptual one.<br />

However, the visual analysis of large and complex datasets involves both visual and<br />

computational challenges. Visual limits involve perceptual and cognitive limitations of the<br />

user and restrictions of the display devices while computational limits are related to the<br />

computational complexity of the involved algorithms.<br />

The goal of this thesis is to advance the state of the art in visual analysis with respect to the<br />

scalability to large datasets. Due to the multifaceted nature of scalability, the contributions<br />

span a broad range to enhance computational scalability, to improve the visual scalability of<br />

selected visualization approaches, and to support an analysis of high-dimensional data.<br />

Concerning computational scalability, this thesis describes a generic architecture to facilitate<br />

the development of highly interactive visual analysis tools using multi-threading. The<br />

architecture builds on the separation of the main application thread and dedicated<br />

visualization threads, which can be cancelled early due to user interaction. A quantitative<br />

evaluation shows fast visual feedback during continuous interaction even for millions of<br />

entries.<br />

Two variants of scatterplots address the visual scalability of different types of data and tasks.<br />

For continuous data, a combination of 2D and 3D scatterplots intends to combine the<br />

advantages of 2D interaction and 3D visualization. Several extensions improve the depth<br />

perception in 3D and address the problem of unrecognizable point densities in both 2D and<br />

3D.<br />

For partly categorical data, the thesis contributes Hierarchical Difference Scatterplots to relate<br />

multiple hierarchy levels and to explicitly visualize differences between them in the context of<br />

the absolute position of pivoted values.<br />

While comparisons in Hierarchical Difference Scatterplots are only qualitative, this thesis also<br />

contributes an approach for quantifying subsets of the data by means of statistical moments<br />

for a potentially large number of dimensions. This approach has proven useful as an initial<br />

overview as well as for a quantitative comparison of local features like clusters.<br />

As an important application of visual analysis, the validation of regression models also<br />

involves the scalability to multi-dimensional data. This thesis describes a design study of an<br />

approach called HyperMoVal for this task. The key idea is to visually relate n-dimensional<br />

scalar functions to known validation data within a combined visualization. The integration<br />

with other multivariate views is a step towards a user-centric workflow for model building.<br />

- 1 -


Being the result of collaboration with experts in engine design, HyperMoVal demonstrates<br />

how visual analysis is suitable to significantly improve real-world tasks. Positive user<br />

feedback suggests a high impact of the contributions of this thesis also outside the<br />

visualization research community. Moreover, most contributions of this thesis have been<br />

combined in a commercially distributed software framework for engineering applications that<br />

will hopefully raise the awareness and promote the use of visual analysis in multiple<br />

application domains.<br />

Deutsch:<br />

In vielen Bereichen von Wissenschaft und Industrie wachsen die Datenmengen so rasch, dass<br />

sie oftmals nicht mehr ausgewertet werden können. Andererseits birgt die noch nie<br />

dagewesene Verfügbarkeit von Daten ein enormes Potential zur Unterstützung von<br />

Entscheidungsfindungen. Die datenbasierte Wissensgewinnung ist somit eine zentrale<br />

Herausforderung des 21. Jahrhunderts.<br />

Dank der Leistungsfähigkeit des menschlichen Sehapparates ist Visualisierung ein geeignetes<br />

Mittel um große Datenmengen zu verstehen. Speziell interaktive Visualisierungen<br />

ermöglichen einen Diskurs mit Daten, der es erlaubt, kognitive Aufgaben durch visuelle<br />

Wahrnehmung zu lösen. Allerdings umfasst die visuelle Analyse großer und komplexer Daten<br />

Herausforderungen sowohl was die Darstellung, als auch was die Berechnung angeht. Erstere<br />

betreffen perzeptuelle und kognitive Grenzen von Benutzern während letztere eng mit der<br />

Komplexität der eingesetzten Algorithmik zusammenhängen.<br />

Ziel dieser Dissertation ist die Erweiterung des Stands der Technik im Bereich visueller<br />

Analyse bezüglich der Skalierbarkeit <strong>für</strong> große Datenmengen. Entsprechend der vielen<br />

Facetten des Themas Skalierbarkeit spannen die Innovationen dieser Dissertation einen<br />

weiten Bogen von berechnungsbezogener Skalierbarkeit über die Verbesserung der visuellen<br />

Skalierbarkeit ausgewählter Visualisierungsansätze bis hin zur Unterstützung einer Analyse<br />

hochdimensionaler Daten.<br />

Hinsichtlich berechnungsbezogener Skalierbarkeit beschreibt diese Dissertation eine<br />

generische Architektur, um den Einsatz von Multithreading bei der Entwicklung interaktiver<br />

visueller Analysesysteme zu erleichtern. Kern der Architektur ist die Trennung des<br />

Hauptthreads der Applikation von speziellen Visualisierungsthreads sowie deren vorzeitigen<br />

Abbruch im Falle von Benutzerinteraktion. Eine quantitative Evaluierung belegt ein rasches<br />

visuelles Feedback während kontinuierlichen Interaktionen selbst bei Millionen von<br />

Datenwerten.<br />

Zwei Varianten von Punktdiagrammen widmen sich der visuellen Skalierbarkeit<br />

verschiedener Arten von Daten und Aufgaben. Im Falle kontinuierlicher Daten beabsichtigt<br />

eine Kombination aus 2D und 3D Punktdiagrammen die Vorteile zweidimensionaler<br />

Interaktion und dreidimensionaler Visualisierung miteinander zu kombinieren. Diverse<br />

Erweiterungen verbessern die Tiefenwahrnehmung in 3D und widmen sich dem Problem<br />

einer nicht erkennbaren Datendichte sowohl in 2D als auch in 3D. Für den Fall teilweiser<br />

kategorischer Daten beschreibt die Dissertation eine als hierarchische Differenz-<br />

Punktdiagramme (Hierarchical Difference Scatterplots) bezeichnete Technik. Zweck ist es,<br />

mehrere Hierarchiestufen miteinander in Bezug zu setzen und deren Unterschiede in Bezug<br />

auf diverse Aggregate explizit darzustellen.<br />

- 2 -


Während Vergleiche in hierarchischen Differenz-Punktdiagrammen nur qualitativer Natur<br />

sind, stellt diese Dissertation auch einen quantitativen Ansatz vor, der darauf beruht,<br />

statistische Momente von Teilmengen der Daten <strong>für</strong> potentiell viele Dimensionen gleichzeitig<br />

zu ermitteln. Anwendungen dieses Ansatzes umfassen sowohl einen Überblick über die<br />

Gesamtdaten als auch einen quantitativen Vergleich lokaler Charakteristika wie<br />

beispielsweise Cluster.<br />

Die Validierung von Regressionsmodellen ist eine wichtige Anwendung <strong>für</strong> eine visuelle<br />

Analyse, die eine Skalierung hinsichtlich höher dimensionaler Daten erfordert. Für diese<br />

Anwendung wird eine Designstudie eines als HyperMoVal bezeichneten Ansatzes<br />

beschrieben. Kernidee ist es, n-dimensionale Skalarfunktionen mit bekannten<br />

Validierungsdaten in einen gemeinsamen visuellen Bezug zu bringen. Die Integration mit<br />

anderen multivariaten Darstellungen stellt dabei einen Schritt in Richtung eines Benutzerbasierten<br />

Modellbildungsprozesses dar.<br />

Als Ergebnis einer Zusammenarbeit mit Experten im Bereich Motorenentwicklung zeigt<br />

HyperMoVal auch, dass visuelle Analyse geeignet ist, reale Aufgaben erheblich zu<br />

erleichtern. Positives Feedback seitens von Benutzern deutet die Bedeutung der Innovationen<br />

dieser Dissertation auch außerhalb der Forschungsgemeinde im Bereich Visualisierung an.<br />

Umso mehr, als die meisten Innovationen dieser Dissertation in einem gemeinsamen<br />

Softwareframework <strong>für</strong> Ingenieursanwendungen kommerziell vertriebenen werden. Es ist zu<br />

hoffen, dass dieses das Bewusstsein um die Möglichkeiten visueller Analyse und deren<br />

Anwendung in unterschiedlichen Bereichen steigern wird.<br />

- 3 -

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!