Lukas' Blog - von Lukas Graber

Lukas' Blog - von Lukas Graber Lukas' Blog - von Lukas Graber

28.02.2013 Aufrufe

84 95. Blogeintrag (So, 24.01.10) der Reihe nach. Wie begann das eigentlich mit diesen die CPU unterstützenden Prozessoren? Die erste Anwendung waren Fliesskomma-Rechenknechte. Ich kann mich erinnern, ohne Gleitkommazahlen programmiert zu haben. Das ist recht mühsam – oder alternativ sehr langsam. So hat Intel zu ihren x86-CPUs die x87-Co-Prozessoren kreiert (Intel 8087, 80287 und 387 – im Prinzip gab es auch einen 487, aber das war ein Trick). Bei entsprechenden Anwendungen, z.B. trigonometrischen Funktionen, konnten sie zu einem enormen Geschwindigkeitszuwachs führen (angeblich bis 100-fach). Ab dem 486 (nur die DX-Variante) integrierte Intel die Fliesskommaeinheit in die CPU. Und heute erinnert sich (fast) niemand mehr daran, dass es früher separate Chips waren. Ein nächster Co-Prozessor-Typ spezialisierte sich auf die Grafikberechnung. Als noch ”http://www.youtube.com/watch?v=xWDAFk2PJzg feature=related” Accolades ”Winter Challenge” das Mass aller Dinge war (für Nostalgiker: ”http://www.youtube.com/watch?v=f-VPhDnRwdk” Titus the Fox, ”http://www.youtube.com/watch?v=LhQqPtiErB8” Blues Brothers, ”http://www.youtube.com/watch?v=-zyQ-OVyhNE” Prince of Persia, ”http://www.youtube.com/watch?v=FLhyb2lkTBg” Railroad Tycoon, ”http://www.youtube.com/watch?v=N4sj2Rf1RFg” Dune II, ”http://www.youtube.com Battle Isle, ”http://www.youtube.com/watch?v=ZZf9CWlF-iA” 4D Sports Driving, ”http://www.youtube.com/watch?v=GbzioZBTUIU” Wing Commander, ”http://www.youtube.com/watch?v=VWghOA692w0” X-Wing, ”http://www.youtube.com/watch?v=359qyiXskCE” Rebel Assault, ”http://www.youtu eIHJU” Dark Forces, ”http://www.youtube.com/watch?v=PDTFglX6-HQ” Indiana Jones 3, ”http://www.youtube.com/watch?v=WjvD3C-nvBk” Monkey Island – Man merke: ”http://www.youtube.com/watch?v=j6fj-roXP0s” Nie den Groove verlieren.), da kamen die ersten Grafik-Beschleunigerkarten auf, wie beispielsweise die ”http://www.overclockers.com.ua/blogs/blog/museum/116.h Cirrus Logic GD5420. Unvergessen auch die Trident-, S3- und Oak-Karten. Bald reichte der ISA-Bus für die Datenübertragung nicht mehr und musste übergangsweise dem Vesa Local-Bus und dann aber mit mehr Erfolg dem PCI-Bus Platz machen. Das Besondere an einem auf Grafikanwendungen spezialisierter Co- Prozessor ist die SIMD-Architektur. Gegenüber der klassischen und universelleren MIMD-Auslegung, wie heutige CPUs, werkeln hunderte, vergleichsweise einfache Prozessoren, synchron. In meiner GTX-260 sind das 216 sogenannte Stream Processors. Dies summiert sich auf 1.4 Mia Transistoren, also doppelt so viele wie in meiner CPU (Core i7, Bloomfield). Wobei natürlich die ständigen Verwechslungen bezüglich ”http://de.wikipedia.org/wiki/Langeund-kurze-Leiter” kurzer und langer Leiter (wie wär’s, wenn man das mal normieren würde?) auch nicht gerade zur Entwirrung beitragen. Mit 240

dem integrierten, sehr schnellen und breit angebundenen Speicher führt dies zu äusserst schnellen Rechenspezialisten, welche vermehrt auch für ”http://www.eng.cam.ac.uk/ gp10006/research/Pullan-GPUs-Jan08.pdf” Berechnungen in Forschung und Entwicklung eingesetzt werden. Es gibt gar ”Grafikkarten” ohne Monitoranschluss, welche ausschliesslich diesem Ziel dienen. Ich habe mir diesbezüglich für meine ”http://www.greatlakesconsortium.org/eve talk.pdf” CFD-Simulationen auch Gedanken gemacht. Der Fermi-Chip, wie oben erwähnt, ist nun nVidias neueste Kreation und wird heiss erwartet. Es wird sowohl über die Rechenleistung als auch über die elektrische Leistung spekuliert und teilweise verbissen debattiert. Aktuell gilt März 2010 als Erscheinungstermin. Der elektrische Leistungsbedarf moderner GPUs übersteigt jenen einer CPU deutlich. In Notebooks sind solche ”Heizungen” absolut undenkbar; zudem ist diese Grafikleistung oft nicht notwendig. Daher sind für diese Anwedung – und das macht 90 Und noch ein Beispiel für einen weit verbreiteten Co-Prozessor: Der Digitale Signalprozessor (DSP) für die Tonausgabe. Nachdem die ersten Soundkarten auf dem Markt geworfen wurden, hat sich gezeigt, dass komplexe Tonsignalmanipulationen, z.B. so simple Dinge wie das Hinzufügen von Hall/Echo, die CPU ganz schön arg belasten. Die erste Creative- Soundkarte mit DSP, die ”http://en.wikipedia.org/wiki/Sound-Blaster” Sound Blaster Live!, hatte einen EMU10k1 an Bord. Dieser DSP bestand aus relativ bescheidenen 2.44 Mio Transistoren (350 nm). Die Audigy hatte dann den leicht verbesserten EMU10K2 mit bereits 4 Mio Transistoren. Richtig zur Sache ging es mit der X-Fi-Lösung, welche je nach Ausführung entweder den EMU20K1 (51 Mio Trans. in 130 nm) oder den EMU20K2 (54 Mio Trans. in 90 nm) beherbergt. Wer hätte gedacht, dass solch ein DSP bereits mehr Transistoren als die CPU meines ehrwürdigen, und bis vor kurzem noch im Einsatz stehenden, Pentium IV aufweisen würde? OK, das stimmt nicht ganz: Erste Pentium IV Serien (Willamette) hatten nur 42 Mio Transistoren, doch meine CPU aus der Prescott-Serie bereits 125 Mio (liegt hauptsächlich am vergrösserten L2-Cache). Ob diese Sound-Co- Prozessoren wohl auch bald in die CPU wandern, ähnlich wie FPU und GPU? Zusammenfassend beobachte ich bei allen die CPU unterstützenden Prozessoren die folgende Reihe: separate Einsteckkarte - Integration auf das Mainboard - Integration in den Chipsatz - Integration in die CPU. Da dieser Blog-Eintrag einiges an Nostalgie beinhaltet, hier noch ein Tipp an alle, die mit mir am ”http://greatoutdoorsacademy.files.wordpress.com/2009/01/maj 500px.jpg” Mount Hood skifahren waren: ”http://www.bing.com/?cc=de” Microsofts Bing-Suchmaschine zeigt dieser Tage ein lustiges Hintergrund- 241

84 95. <strong>Blog</strong>eintrag (So, 24.01.10)<br />

der Reihe nach. Wie begann das eigentlich mit diesen die CPU unterstützenden<br />

Prozessoren? Die erste Anwendung waren Fliesskomma-Rechenknechte.<br />

Ich kann mich erinnern, ohne Gleitkommazahlen programmiert zu haben.<br />

Das ist recht mühsam – oder alternativ sehr langsam. So hat Intel zu ihren<br />

x86-CPUs die x87-Co-Prozessoren kreiert (Intel 8087, 80287 und 387 – im<br />

Prinzip gab es auch einen 487, aber das war ein Trick). Bei entsprechenden<br />

Anwendungen, z.B. trigonometrischen Funktionen, konnten sie zu einem<br />

enormen Geschwindigkeitszuwachs führen (angeblich bis 100-fach). Ab<br />

dem 486 (nur die DX-Variante) integrierte Intel die Fliesskommaeinheit<br />

in die CPU. Und heute erinnert sich (fast) niemand mehr daran, dass es<br />

früher separate Chips waren.<br />

Ein nächster Co-Prozessor-Typ spezialisierte sich auf die Grafikberechnung.<br />

Als noch ”http://www.youtube.com/watch?v=xWDAFk2PJzg feature=related”<br />

Accolades ”Winter Challenge” das Mass aller Dinge war (für<br />

Nostalgiker: ”http://www.youtube.com/watch?v=f-VPhDnRwdk” Titus<br />

the Fox, ”http://www.youtube.com/watch?v=LhQqPtiErB8” Blues Brothers,<br />

”http://www.youtube.com/watch?v=-zyQ-OVyhNE” Prince of Persia,<br />

”http://www.youtube.com/watch?v=FLhyb2lkTBg” Railroad Tycoon,<br />

”http://www.youtube.com/watch?v=N4sj2Rf1RFg” Dune II, ”http://www.youtube.com<br />

Battle Isle, ”http://www.youtube.com/watch?v=ZZf9CWlF-iA” 4D Sports<br />

Driving, ”http://www.youtube.com/watch?v=GbzioZBTUIU” Wing Commander,<br />

”http://www.youtube.com/watch?v=VWghOA692w0” X-Wing,<br />

”http://www.youtube.com/watch?v=359qyiXskCE” Rebel Assault, ”http://www.youtu<br />

eIHJU” Dark Forces, ”http://www.youtube.com/watch?v=PDTFglX6-HQ”<br />

Indiana Jones 3, ”http://www.youtube.com/watch?v=WjvD3C-nvBk” Monkey<br />

Island – Man merke: ”http://www.youtube.com/watch?v=j6fj-roXP0s”<br />

Nie den Groove verlieren.), da kamen die ersten Grafik-Beschleunigerkarten<br />

auf, wie beispielsweise die ”http://www.overclockers.com.ua/blogs/blog/museum/116.h<br />

Cirrus Logic GD5420. Unvergessen auch die Trident-, S3- und Oak-Karten.<br />

Bald reichte der ISA-Bus für die Datenübertragung nicht mehr und musste<br />

übergangsweise dem Vesa Local-Bus und dann aber mit mehr Erfolg dem<br />

PCI-Bus Platz machen.<br />

Das Besondere an einem auf Grafikanwendungen spezialisierter Co-<br />

Prozessor ist die SIMD-Architektur. Gegenüber der klassischen und universelleren<br />

MIMD-Auslegung, wie heutige CPUs, werkeln hunderte, vergleichsweise<br />

einfache Prozessoren, synchron. In meiner GTX-260 sind das 216<br />

sogenannte Stream Processors. Dies summiert sich auf 1.4 Mia Transistoren,<br />

also doppelt so viele wie in meiner CPU (Core i7, Bloomfield). Wobei natürlich<br />

die ständigen Verwechslungen bezüglich ”http://de.wikipedia.org/wiki/Langeund-kurze-Leiter”<br />

kurzer und langer Leiter (wie wär’s, wenn man das<br />

mal normieren würde?) auch nicht gerade zur Entwirrung beitragen. Mit<br />

240

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!