31.07.2015 Aufrufe

Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

3 <strong>Dimension</strong>-Exchange-VerfahrenAußerdem sind die Resultate bei DE-FOS für α = 1 2<strong>mit</strong>unter noch recht weit vom Optimumentfernt, vergleiche hierzu auch Tabelle 3.1. Beim einfachen First-Order-Schemeist die symmetrische Variante also nicht konkurrenzfähig.x = 0for k = 1, 2, . . . doŵ 0 = w k−1for j = 1, . . . , c do {1. Farbschleife (vorwärts)}ŵ j = M j ŵ j−1x = x + αA T j ŵj−1end forfor j = c, . . . , 1 do {2. Farbschleife (rückwärts)}ŵ 2c−j+1 = M j ŵ 2c−jx = x + αA T j ŵ2c−jend forw k = ŵ 2cend forAlgorithmus 3.4: SDE-FOS-Verfahren, Version <strong>mit</strong> den Schleifen über die FarbenIn der Regel ist DE-FOS sogar schneller als SOS und Čebyšev, siehe Tabelle 3.1. Allerdingssollte man hierbei nicht übersehen, dass die Bestimmung des optimalen Wertesvon α für Graphen, über die Satz 3.11 keine Aussage trifft (z. B. der T 7 ), <strong>auf</strong>wändig seinkann.Graph FOS SOS Čebyšev DE-FOS DE-FOS SDE-FOSα = α opt α = 1 2α = 1 2C 12 48 17 14 6 23 23G 8 173 33 27 9 44 44T 8 47 17 14 4 10 10T 7 34 14 12 6 8 9Tabelle 3.1: Anzahl der Schritte verschiedener Verfahren an vier Beispielgraphen beijeweils identischer, zufälliger AusgangslastverteilungIn Abbildung 3.1 ist an Hand von vier Graphen dargestellt, wie die Anzahl der benötigtenSchritte bei verschiedenen Verfahren von α abhängt. Da globale Kommunikationwährend des Abl<strong>auf</strong>s der Verfahren grundsätzlich vermieden werden soll, wird die Anzahlder Schritte im Voraus (nach einer globalen Summe) <strong>mit</strong> <strong>Hilfe</strong> einer Fehlerabschätzungberechnet. Die Ausgangslastverteilung war zufällig, aber für alle Testfälle identisch —am Ende sollte jeder Knoten 100 Lasteinheiten haben. Bei den Diffusionsverfahren darfα nicht größer werden als der Kehrwert des maximalen Knotengrades, da die Diffusionsmatrizensonst negative Diagonalelemente hätten.44

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!