Untitled

Weitere Magazine

Empfehlungen

Info

} } 3.1 Parallelität auf Schleifenebene 33 for(unsigned int i = 0; i < x.size(); ++i ) { y[i] += a * x[i]; } Der Effekt ist nicht der beabsichtigte: Statt dass sich die Threads im Team die Arbeit untereinander aufteilten, führt jeder der Threads die gesamte Berechnung aus! Bei n Threads wird die ganze Schleife also unnötigerweise nmal ausgeführt. Im besten Fall wird n-mal a ∗ x[i] zu y[i] addiert. Hinzu kommen mögliche unbeabsichtige Seiteneffekte, da die Threads unsynchronisiert auf die gemeinsam genutzten Vektoren zugreifen und es so zu einer Wettlaufsituation (engl. Race Condition) kommen kann (siehe hierzu auch Kapitel 1.2.1). Dies ist z. B. dann der Fall, wenn zwei parallele Threads den gleichen Wert für die Schleifenvariable i zur Zeit bearbeiten, den Wert von y[i] jeweils gelesen haben und davor stehen, den neuen Wert von y[i] zu schreiben. Beide Threads arbeiten in diesem Fall mit dem alten Wert von y[i]. Die Änderung durch den Thread, der zuerst seinen neuen, um a ∗ x[i] erhöhten Wert nach y[i] schreibt, wird durch den nachfolgenden Thread überschrieben. Die Änderung von y[i] durch den ersten Thread geht also verloren. Vielmehr benötigt man für dieses Programm das Arbeit aufteilende Pragma #pragma omp for, um dem Compiler mitzuteilen, die Schleifendurchläufe auf mehrere Threads innerhalb des Teams, das den parallelen Abschnitt ausführt, aufzuteilen, wie in Listing 3.3 gezeigt.
34 3 Parallelisierung von Schleifen Listing 3.3. SAXPY mit #pragma omp for parallelisiert void saxpyParallel(const float a, const vector & x, vector & y) { assert(x.size() == y.size()); #pragma { omp parallel #pragma omp for for(int { i = 0; i < x.size(); ++i) y[i] += a * x[i]; } } } Hierbei fällt auf, dass die Schleifenvariable i nun vom Typ int und nicht mehr wie in Listing 3.1 vom Typ unsigned int ist. Dies liegt an der Beschränkung, dass Zählvariablen zu parallelisierender for-Schleifen vorzeichenbehaftete ganze Zahlen – in C/C++ also vom Typ int – sein müssen 1 . Der Compiler mahnt die Verwendung des falschen Typs an. Damit eine for-Schleife parallelisiert werden kann, fordert OpenMP, dass eine Schleife for(index = startwert; index op endwert; inkrement) Anweisung in kanonischer Form vorliegt. Hierzu müssen folgende Bedingungen erfüllt sein: • Die Anzahl der Schleifendurchläufe muss vor dem Eintritt in die Schleife basierend auf der Ober- und Untergrenze des Werts der Zählvariablen index und der 1 Ab OpenMP 3.0 werden auch vorzeichenfreie ganze Zahlen erlaubt sein.
Seite 2 und 3: Informatik im Fokus Herausgeber: Pr
Seite 4 und 5: Simon Hoffmann · Rainer Lienhart O
Seite 6 und 7: Vorwort Seit der Einführung der Hy
Seite 8 und 9: Inhaltsverzeichnis 1 Einführung ..
Seite 10 und 11: Inhaltsverzeichnis IX 4.5 Synchroni
Seite 12 und 13: 1 Einführung OpenMP ist eine Progr
Seite 14 und 15: 1.1 Merkmale von OpenMP 3 genannte)
Seite 16 und 17: 1.1 Merkmale von OpenMP 5 Alle Anwe
Seite 18 und 19: 1.2 Parallele Programmierung 7 Werd
Seite 20 und 21: 1.2 Parallele Programmierung 9 •
Seite 22 und 23: 1.2 Parallele Programmierung 11 da
Seite 24 und 25: 1.2 Parallele Programmierung 13 der
Seite 26 und 27: 1.2 Parallele Programmierung 15 Alg
Seite 28 und 29: 1.2 Parallele Programmierung 17 che
Seite 30 und 31: 1.2 Parallele Programmierung 19 nä
Seite 32 und 33: 1.2 Parallele Programmierung 21 une
Seite 34 und 35: 24 2 Das OpenMP-Ausführungsmodell
Seite 40 und 41: 3 Parallelisierung von Schleifen Hi
Seite 44 und 45: 3.1 Parallelität auf Schleifeneben
Seite 46 und 47: 3.2 Zugriff auf Variablen und Kommu
Seite 68 und 69: 3.3 Ablaufpläne mit schedule 59 3.
Seite 70 und 71: 3.3 Ablaufpläne mit schedule 61 ty
Seite 72 und 73: 3.3 Ablaufpläne mit schedule 63 Ei
Seite 74 und 75: 3.4 Anzahl der Threads in einem Tea
Seite 76 und 77: 3.5 Datenabhängigkeiten 67 zwei, w
Seite 78 und 79: 3.5 Datenabhängigkeiten 69 Threads
Seite 80 und 81: } 3.5 Datenabhängigkeiten 71 vec[i
Seite 82 und 83: 3.5 Datenabhängigkeiten 73 Das Pro
Seite 84 und 85: 3.5 Datenabhängigkeiten 75 3.5.6 E
Seite 86 und 87: x = (vb[i] + vc[i])/2.0f; va[i] +=
Seite 88 und 89: 3.5 Datenabhängigkeiten 79 der Zuw
Seite 90 und 91: } 3.5 Datenabhängigkeiten 81 x +=
Seite 92 und 93:
3.7 Implizite Barrieren mit nowait
Seite 94 und 95:
3.8 Paralleles Traversieren von Con
Seite 96 und 97:
3.8 Paralleles Traversieren von Con
Seite 98 und 99:
90 4 Synchronisation Wie wir gesehe
Seite 100 und 101:
92 4 Synchronisation ist (wenn alle
Seite 102 und 103:
94 4 Synchronisation Die Verwendung
Seite 104 und 105:
96 4 Synchronisation teile gegenüb
Seite 106 und 107:
98 4 Synchronisation critical 30, 9
Seite 108 und 109:
100 4 Synchronisation finiert,welch
Seite 110 und 111:
102 4 Synchronisation Listing 4.3.
Seite 112 und 113:
104 4 Synchronisation • Der durch
Seite 114 und 115:
106 4 Synchronisation 4.6.1 Barrier
Seite 116 und 117:
108 4 Synchronisation } Die Reihenf
Seite 118 und 119:
110 4 Synchronisation bis alle modi
Seite 120 und 121:
112 4 Synchronisation flag = true;
Seite 122 und 123:
114 5 Parallele Abschnitte initVect
Seite 124 und 125:
116 5 Parallele Abschnitte } #pragm
Seite 126 und 127:
118 5 Parallele Abschnitte die Ausf
Seite 128 und 129:
120 5 Parallele Abschnitte printf("
Seite 130 und 131:
122 5 Parallele Abschnitte zu platz
Seite 132 und 133:
6 Parallele Aufgaben Historisch ges
Seite 134 und 135:
6.1 Eine Task-Warteschlange mit Ope
Seite 136 und 137:
6.2 Intel-spezifische Erweiterungen
Seite 138 und 139:
Seite 140 und 141:
Seite 142 und 143:
6.3 Ausblick auf die task-Direktive
Seite 144 und 145:
6.3 Ausblick auf die task-Direktive
Seite 146 und 147:
7 Die OpenMP-Laufzeitbibliothek Die
Seite 148 und 149:
7.2 Parameter der Laufzeitumgebung
Seite 150 und 151:
7.3 Synchronisation 7.3 Synchronisa
Seite 152 und 153:
146 8 Effiziente Parallelisierung a
Seite 154 und 155:
148 8 Effiziente Parallelisierung W
Seite 156 und 157:
150 8 Effiziente Parallelisierung F
Seite 158 und 159:
152 8 Effiziente Parallelisierung d
Seite 160 und 161:
154 8 Effiziente Parallelisierung I
Seite 162 und 163:
156 Literaturverzeichnis 7. Frank B
Seite 164:
158 Literaturverzeichnis 34. Holger
Alle anzeigen

Untitled

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?