Blu Architektur

Blu-Architektur

Neue Turing GPU Architektur - 16T-Flops! Die neue GPU-Architektur "Turing", die für die nächste Grafikkartengeneration eingesetzt wird, ist nun endlich eingeweiht. Auf der Siggraph 2018 präsentierte die Firma die lang ersehnte neue Turing-Architektur. Der Quadro RTX 8000, Quadro RTX 6000 und Quadro RTX 5000, hat noch nicht angekündigt, wann er die ersten Geforce-Karten mit Turing-Architektur einführen wird.

Noch in diesem Jahr wird die neue GTX 2080 vorgestellt. Bis zu 25 Mal so schnell wie mit der bisherigen Pascal-Architektur und bis zu 30 Mal so schnell wie mit einer CPU, wie Nvidia hervorhebt. Nvidia ergänzt die bereits mit Volta vorgestellten Tensorkerne um zusätzliche Artificial Intelligence-Funktionen.

Insgesamt beschreibt Nvidia die neue Turing GPU als den grössten Schritt seit der Einführung der CUDA GPU im Jahr 2006. Das Rechentempo wird von Nvidia mit 16 Tera-Flops angegeben.

Nvidia führt neue Grafikprozessor-Architektur ein[Update]

Zunächst erläutert die Firma in ihrem Bericht zu Turing, dass die Sensorkerne 125 TFLOPS mit FP16, 250 TFLOPS mit INT8 und 500 TFLOPS mit INT4 Genauigkeit haben. Die L2-Cache von Turing ist mit 6 MiB spezifiziert. Das Statement "Turing ist 6x so schnell wie Pascal" wird in der Darstellung mit Epics Unreal Engine-basierten Raytracing-Demos auf Basis des Microsoft API DirectX Raytracing behandelt.

Mit DLAA ( "Deep Learning Anti-Aliasing") führt die Firma ein, eine Methode zur Bildverbesserung, die mit künstlicher Intelligenz eine schnelle Berechnung der Randglättung mit 64 rotierten Proben ermöglicht. Auf der Siggraph stellte Chef Huang in seiner Eröffnungsrede eine neue GPU-Architektur mit Turing vor. Mit den Quadro RTX 5000, 6000 und 8000 Workstation -Grafikkarten, die zur gleichen Zeit angekündigt wurden, hat die Firma die Nachricht erhalten, dass sie neue Marken eingetragen hat.

Nvidia ergänzt das mit Volta vorgestellte Tensorkonzept um spezielle Raytracing-Kerne - seit MÃ??rz 2018 ist die Alternativdarstellung einer 3D-Szene ein Hobby von Nvidia. Bei Nvidia wird von 10 GigaRay pro Sek. als Leistungsmaß gesprochen, im Vergleich zur Pascal-Generation soll das Echtzeit-Raytracing um den Faktor 25 zulegen.

Beim Quadro RTX 8000 ermöglicht der Einsatz der 12-Nanometer-Produktion 4.608 Shader-Einheiten, 576 Tensorkerne und die oben genannten Raytracing-Kerne. Bei Nvidia wird eine FP32-Leistung von 16 TFLOPS angegeben, beim Quadro RTX 8000 werden 48 GiByte GDDR6-RAM (nach Samsung mit 14 Gbps) mit 384-Bit verbunden, was zu einer Übertragungsrate von 672 GByte/s führen würde.

Die Nvidia fordert zwischen 2.300 und 100.000 US-Dollar; die Quadro sollen ab Anfang September erhältlich sein ("viertes Quartal"). Interessanterweise hat der grösste Turing-Chip weniger FP32-ALUs als der Typ V100 Dies ist ein Zugeständnis an Turing's Interpretation, die nicht nur ein Experte für Rasterung ist, sondern vor allem Standards im Raytracing und Deep Learning gesetzt hat.

Dies ist eine Methode zur Vervollständigung der effektiv kalkulierten Rahmen der derzeitigen Implementierung des RAYTACING, die auf brauchbare Frameraten zugeschnitten wurde - ein "volles" RAYTACING ist auch mit der Turing-Vollerweiterung nicht möglich.

Laut Aussage von Navidia wird es möglich sein, den Berechnungsalgorithmus für spätere GPU-Generationen so anzupassen, dass weitere Balken errechnet werden können und eine Rauschunterdrückung nicht mehr erforderlich sein wird. Außerdem vertraut man auf die Verbesserung des Klassik-Screenings, von dem auch Geforce-Turing profitiert. Generell redet er in seiner Pressemitteilung von "6 mal so schnell wie Pascal" und erwähnt neue Verfahren wie "Variable Rate Shading", "Texture-space Shading" und "Multi-view Rendering" - davon sollen Games und VR-Anwendungen profitiert haben.

Die Anandtech geht davon aus, dass sich Turing wie Volta und Vega verhält, wo FP16 -Operationen mit der doppelten Drehzahl und INT8-Operationen mit der vierfachen Drehzahl laufen.

Mehr zum Thema