Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

Weitere Magazine

Empfehlungen

Info

2 DiffusionsverfahrenDie zugehörige Fehlerabschätzung lautet∥∥e k ∥ ∥∥2≤ 2 (β opt − 1) k 21 + (β opt − 1) k ∥ ∥e 0 ∥ ∥2.Das Čebyšev-Verfahren ist also geringfügig besser als SOS.2.3 Endliche Diffusionsverfahren: OPS und OPTBei den bisher vorgestellten Verfahren handelt es sich um nicht-endliche Iterationsverfahren,die mehr oder weniger schnell gegen die Gleichverteilung w konvergieren. In[DFM98, DFM99] wurde ein neues Verfahren vorgestellt, das, ähnlich dem cg-Verfahrenzur Lösung linearer Gleichungssysteme, in endlich vielen Schritten die exakte Lösungbestimmt. Dieses Verfahren wird als Optimal Polynomial Scheme (OPS) bezeichnet.Das Verfahren basiert darauf, dass Polynome p OPSkaus der Menge Π k berechnet werden,die bezüglich des folgenden Innenproduktes orthogonal sind:〈p, q〉 =m∑j=2ω j p(µ Diffj )q(µ Diffj ) (2.1)mit ω j = 1 − µ Diffj . Solche Orthogonalpolynome lassen sich mit Hilfe einer Dreitermrekursion〈berechnen. Das (m − 1)-te Polynom ist zu sich selbst orthogonal, d. h. es istpOPSm−1 , 〉 pOPS m−1 = 0 und somit gilt pOPSm−1 (µDiff i ) = 0 für i = 2, . . . , m.Um das Verfahren durchführen zu können, müssen zunächst alle Eigenwerte µ Diffi derDiffusionsmatrix M Diff bekannt sein. Außerdem müssen vorab Parameter α i , β i und γ iberechnet werden. Für k = 0, . . . , m − 1 sind die Polynome p OPSkgegeben durchp OPS0 (t) = 1p OPS1 (t) = 1 γ 1[(α 1 − t) p OPS0 (t)]p OPSk (t) = 1 [](α k − t) p OPSk−1γ (t) − β kp OPSk−2 (t) , k = 2, . . . , m − 1kmit〈tpOPSk−1α k =, 〉pOPS k−1〈pOPSk−1 , 〉 , k = 1, . . . , m − 1 (2.2)pOPS k−1〈pOPSk−1β k = γ , 〉pOPS k−1k−1 〉, k = 2, . . . , m − 1 (2.3)〈pOPSk−2 , pOPS k−2γ 1 = α 1 − 1, γ k = α k − 1 − β k , k = 2, . . . , m − 1 . (2.4)Sind diese Größen einmal berechnet, dann kann das eigentliche in Algorithmus 2.4dargestellte OPS-Verfahren durchgeführt werden.30
w 1 = 1 γ 1[α1 w 0 − M Diff w 0]x 1 = 1 γ 1αA Diff T w 0for k = 2, . . . , m − 1 dow k = 1 [γ αk kw k−1 − M Diff w k−1 − β k w[k−2]]x k = 1γ k(α k − 1) x k−1 − αA Diff T w k−1 − β k x k−2end for2.3 Endliche Diffusionsverfahren: OPS und OPTAlgorithmus 2.4: OPS-VerfahrenAllgemein gilt bei polynomialen Loadbalancing-Verfahren nach Lemma 2.17 für dieFehlerm∑e k = p k (µ Diffi )z i ,i=2wobei die z i wieder Eigenvektoren von M Diff sind. Beachtet man, dass die z i paarweiseorthogonal sind, erhält man nach Übergang zur euklidischen Norm∥∥∥e k ∥∥2m ( = ∑m)p k (µ Diffi ) 2 ‖z i ‖ 2 2 ≤ ∑p k (µ Diffi ) 2 mmax ‖z i‖ 22 i=22 .i=2In [DFM99] wird gezeigt, dass der Faktor ∑ mi=2 p k(µ Diffi ) 2 aus der letzten Abschätzung∑für obige Wahl der ω i in jedem Schritt minimal wird. Insbesondere ist e m−1 =mi=2 p m−1(µ Diffi )z i = 0 und damit w m−1 = w.Die Konvergenz der verschiedenen Diffusionsverfahren (FOS, SOS, Čebyšev und OPS)ist in Abbildung 2.1 am Beispiel eines Zyklus der Länge 12 dargestellt. Für die Parameterα bzw. β wurden in den entsprechenden Verfahren jeweils die optimalen Wertegewählt. In dem Diagramm wird die Überlegenheit des OPS-Verfahrens deutlich, SOSund Čebyšev unterscheiden sich nur geringfügig, FOS ist nicht konkurrenzfähig. In derAbbildung wie auch in allen anderen Beispielen, sofern nicht anders angegeben, beträgtdie Gesamtlast 100·n, wobei n die Anzahl der Knoten ist. Die Ausgangsverteilung wurdezufällig erzeugt. Bei den nicht-endlichen Verfahren wird jeweils iteriert, bis der absoluteFehler in der l 2 -Norm garantiert kleiner ist als 0,5. Denn schließlich muss am Ende derRechnung jeder Lastwert auf die nächste natürliche Zahl gerundet werden, da nur ganzeLasteinheiten verschoben werden können. In den Beispielen bleibt also ein relativerFehler von 0,5 %. Beim Vergleich der Verfahren sollte man also nicht vergessen, dassdie Anzahl der Schritte bei den nicht-endlichen Verfahren mit wachsender Gesamtlastzunimmt, bei den endlichen Verfahren dagegen konstant ist.Das OPS-Verfahren ist im Gegensatz zu den anderen Verfahren etwas aufwändiger zuimplementieren, da zunächst die Skalare α k , β k und γ k aus den Eigenwerten berechnetwerden müssen. In [EFMP99] wird mit dem OPT -Verfahren ein anderer Algorithmusvorgestellt, der wesentlich einfacher und unmittelbar verständlich ist. Er kommt ohnedie Dreitermrekursion aus, vgl. Algorithmus 2.5. Auch wenn die Eigenwerte im Algorithmusaufsteigend durchlaufen werden, hat die Reihenfolge bei exakter Rechnung keineni=231
Seite 1: Loadbalancingauf Parallelrechnernmi
Seite 5: Inhaltsverzeichnis8 Zusammenfassung
Seite 9: Abbildungsverzeichnis2.1 Konvergenz
Seite 13 und 14: VorwortLoadbalancing-Verfahren werd
Seite 15: Kapitel 5 enthält Hinweise zur Imp
Seite 18: 1 EinleitungVor Ausführung eines L
Seite 21 und 22: 1.5 Kommunikationsmodelle und Verfa
Seite 23: 1.9 Bezeichnungen für spezielle Ma
Seite 26 und 27: 2 Diffusionsverfahren(Definition 2.
Seite 28 und 29: 2 DiffusionsverfahrenLemma 2.17 ([D
Seite 32 und 33: 2 DiffusionsverfahrenC 1210 210 00
Seite 34 und 35: 2 DiffusionsverfahrenG keinem der o
Seite 36 und 37: 2 Diffusionsverfahren• Leja (1) (
Seite 38 und 39: 2 DiffusionsverfahrenP 810 210 010
Seite 40 und 41: 3 Dimension-Exchange-VerfahrenBeim
Seite 43 und 44: 3.4 Ein erstes Dimension-Exchange-V
Seite 45: 3.4 Ein erstes Dimension-Exchange-V
Seite 48 und 49: 3 Dimension-Exchange-Verfahrenŵ 0
Seite 50 und 51: 3 Dimension-Exchange-Verfahrenbekan
Seite 52 und 53: 3 Dimension-Exchange-VerfahrenDefin
Seite 54 und 55: 3 Dimension-Exchange-Verfahrenmit(
Seite 56 und 57: 3 Dimension-Exchange-Verfahren1 2 3
Seite 58 und 59: 3 Dimension-Exchange-Verfahrenwobei
Seite 60 und 61: 3 Dimension-Exchange-VerfahrenM DE
Seite 62 und 63: 3 Dimension-Exchange-Verfahrenbzw.
Seite 64 und 65: 3 Dimension-Exchange-VerfahrenGraph
Seite 66 und 67: 3 Dimension-Exchange-Verfahren‖x(
Seite 68 und 69: 3 Dimension-Exchange-VerfahrenKommu
Seite 70 und 71: 3 Dimension-Exchange-Verfahrenfolge
Seite 72 und 73: 3 Dimension-Exchange-VerfahrenBewei
Seite 74 und 75: 3 Dimension-Exchange-Verfahren2. Di
Seite 76 und 77: 3 Dimension-Exchange-VerfahrenNach
Seite 78 und 79: 3 Dimension-Exchange-VerfahrenBewei
Seite 80 und 81:
3 Dimension-Exchange-VerfahrenBewei
Seite 82 und 83:
3 Dimension-Exchange-VerfahrenDie l
Seite 84 und 85:
3 Dimension-Exchange-VerfahrenK.-Sc
Seite 86 und 87:
3 Dimension-Exchange-VerfahrenGraph
Seite 88 und 89:
3 Dimension-Exchange-Verfahrenverbe
Seite 90 und 91:
4 Verfahren für Produktgraphenfor
Seite 92 und 93:
4 Verfahren für Produktgraphen‖x
Seite 94 und 95:
4 Verfahren für ProduktgraphenG 16
Seite 96 und 97:
4 Verfahren für Produktgraphenx =
Seite 98 und 99:
4 Verfahren für ProduktgraphenWäh
Seite 100 und 101:
4 Verfahren für Produktgraphen( )(
Seite 102 und 103:
4 Verfahren für ProduktgraphenExpe
Seite 104 und 105:
4 Verfahren für Produktgraphen1.25
Seite 106 und 107:
4 Verfahren für ProduktgraphenVerf
Seite 108 und 109:
108
Seite 110 und 111:
5 Details zur Implementierung und M
Seite 112 und 113:
Seite 114 und 115:
Seite 116 und 117:
Seite 118 und 119:
Seite 120 und 121:
Seite 122 und 123:
6 Scheduling-VerfahrenGemäß [DFM9
Seite 124 und 125:
6 Scheduling-Verfahren∥ ∥ x k
Seite 126 und 127:
6 Scheduling-Verfahrenα Ges.-last
Seite 128 und 129:
7 Kurze AusblickeWeitere, insbesond
Seite 130 und 131:
8 Zusammenfassung der Ergebnisse∥
Seite 132 und 133:
Literaturverzeichnis[EFMP99] Robert
Alle anzeigen

Loadbalancing auf Parallelrechnern mit Hilfe endlicher Dimension ...

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?