Nvidia-GeForce-30-Serie

aus Wikipedia, der freien Enzyklopädie
Gigabyte GeForce RTX 3090 Eagle OC 24G

Die GeForce-30-Serie ist eine Serie von Grafikchips des Unternehmens Nvidia und Nachfolger der GeForce-20-Serie. Alle Grafikprozessoren basieren auf der Ampere-Architektur und unterstützen das Shadermodell 6.5 nach DirectX 12 Ultimate. Die Grafikkarten wurden am 1. September 2020 offiziell vorgestellt.

Ampere-Architektur

Die Ampere-Architektur ist eine Weiterentwicklung der Turing-Architektur und behält deren Grundgerüst aus Graphics-Processing-Cluster (GPC), Texture-Processing-Cluster (TPC) und Streaming-Multiprozessoren (SM) bei. Innerhalb dieses Gerüsts wurde jedoch der Aufbau deutlich modifiziert. Statt getrennte Einheiten für Fließkomma- (FP32) und Integer- (INT32) Berechnungen zu verwenden, beherrschen nun sämtliche Recheneinheiten FP32. Dadurch erhöht sich die Anzahl der CUDA-Kerne von 64 auf 128 je SM (Streaming Multiprozessor). Für reine FP32-Berechnungen wurde so die theoretische Rechenleistung verdoppelt, während für kombinierten FP32- und INT32-Berechnungen die Rechenleistung gleich bleibt.

Die ROPs sind nicht mehr den Speicherinterfaces zugeordnet, sondern den GPCs, wodurch ihre Zahl bei dem größten vorgestellten Chip (GA102) auf 112 steigt, von 96 bei dem direkten Vorgänger. Für die RTX 3080 wird ein GPC deaktiviert, wodurch die Zahl der ROPs auf 96 sinkt. Bei erwähntem GA102-Chip setzt Nvidia erstmal auf GDDR6X-Speicher von Micron Technology, während günstigere Grafikkarten weiter GDDR6 nutzen. GDDR6X ermöglicht eine deutlich höhere Bandbreite unter anderem durch das PAM4-Verfahren, das Platinen-Layout wird jedoch hierdurch komplexer.

Während die RTX 3060, 3070 und 3080 die direkten Nachfolger der RTX 2060, 2070 und 2080 (Super) sind, wird die als 8K-Gaming-fähig angepriesene RTX 3090[1] als Nachfolgerin der Titan RTX angesehen. Begründet wird dies mit derselben Größe des Videospeichers und dem Einsatzbereich des professionellen 3D-Renderings.[2]

Der Energiebedarf steigt gegenüber der Turing-Generation erheblich an und erreicht 350 Watt für das Top-Modell RTX 3090 (Vorgänger RTX 2080 Ti: 260 Watt) bzw. 220 Watt und 200 Watt für die kleineren Modelle RTX 3070 sowie RTX 3060 Ti (Vorgänger RTX 2070: 175 – 185 Watt bzw. RTX 2060: 160 Watt). [3] [4]

Datenübersicht

Grafikprozessoren

Grafik-
chip
Fertigung Einheiten L2-
Cache
API-Support Video-
pro-
zessor
Bus-
Schnitt-
stelle
NV-
Link
Prozess Transis-
toren
Die-
Fläche
ROPs Unified-Shader Textur-
einheiten
Tensor-
Kerne
RT-
Kerne
DirectX OpenGL OpenCL CUDA Vulkan
GPC SM ALUs
GA102 Samsung
8 nm
28,3 Mrd. 628 mm² 112 7 84 10752 336 336 84 6 MB 12.2 4.6 3.0 8.6 1.2.140 VP11 PCIe 4.0 k. A.
GA103S k. A. 496 mm² 096 6 60 07680 240 240 60 4 MB
GA104 17,4 Mrd. 393 mm² 096 6 48 06144 192 192 48 4 MB
GA106 13,25 Mrd. 276 mm² 048 3 30 03840 120 120 30 3 MB
GA107 k. A. k. A. 048 3 24 03072 096 096 24 2 MB

Desktop-Modelldaten

Modell Offizieller
Launch
Grafikprozessor (GPU) Grafikspeicher Leistungsdaten[Anm. 1] Leistungsaufnahme
Typ Aktive Einheiten Chiptakt
[Anm. 2]
Speicher-
größe
Speicher-
takt[Anm. 2]
Speicher-
interface
Rechenleistung
(in TFlops)
Füllrate Speicher-
bandbreite

(in GB/s)
MGCP
[Anm. 3]
Messwerte
[Anm. 4]
ROPs SM ALUs Textur-
einheiten
Tensor-
Kerne
RT-
Kerne
Basis Boost 32 bit 64 bit Pixel
(GP/s)
Texel
(GT/s)
Idle 3D-
Last
GeForce RTX 3050[5] 27. Jan. 2022 GA106 048 20 02560 80 80 20 1552 MHz 1777 MHz 08 GB GDDR6X 7001 MHz 128 Bit 9,1 0,14 85,3 142,2 224 130 W 9 W[6] 129 W[6]
GeForce RTX 3060[7] 25. Feb. 2021 048 28 03584 112 112 28 1320 MHz 1780 MHz 12 GB GDDR6X 7501 MHz 192 Bit 12,7 0,20 85,3 199 360 170 W 13 W[6] 172 W[6]
GeForce RTX 3060 Ti[7] 2. Dez. 2020 GA104 080 38 04864 152 152 38 1410 MHz 1670 MHz 8 GB GDDR6X 7001 MHz 256 Bit 16,25 0,25 133,6 253,8 448 200 W 10 W[6] 202 W[6]
GeForce RTX 3070[8] 29. Okt. 2020 096 46 05888 184 184 46 1500 MHz 1730 MHz 08 GB GDDR6X 7001 MHz 256 Bit 20,31 0,32 166,1 318,3 448 220 W 10 W[6] 221 W[6]
GeForce RTX 3070 Ti[8] 10. Jun. 2021 096 48 06144 192 192 48 1580 MHz 1770 MHz 08 GB GDDR6X 9502 MHz 256 Bit 21,75 0,34 169,9 339,8 608 290 W 12 W[6] 292 W[6]
GeForce RTX 3080[9] 17. Sep. 2020 GA102 096 68 08704 272 272 68 1440 MHz 1710 MHz 10 GB GDDR6X 9502 MHz 320 Bit 29,77 0,47 164,2 465,1 760 320 W 10 W[6] 325 W[6]
11. Jan. 2022 70 08960 280 280 70 12 GB GDDR6X 384 Bit 30,64 0,48 164,2 478,8 912 350 W k. A. 351 W
GeForce RTX 3080 Ti[9] 3. Jun. 2021 112 80 10240 320 320 80 1365 MHz 1665 MHz 12 GB GDDR6X 9502 MHz 384 Bit 34,10 0,53 186,5 532,8 912 350 W 14 W[6] 350 W[6]
GeForce RTX 3090[10] 24. Sep. 2020 112 82 10496 328 328 82 1410 MHz 1695 MHz 24 GB GDDR6X 9752 MHz 384 Bit 35,58 0,56 162,7 556 936 350 W 16 W[6] 359 W[6]
GeForce RTX 3090 Ti[10] 29. Mrz. 2022 112 84 10752 336 336 84 1560 MHz 1860 MHz 24 GB GDDR6X 10502 MHz 384 Bit 40 0,63 208,3 625 1008 450 W 23 W[6] 462 W[6]

Notebook-Modelldaten

Modell Offizieller
Launch
Grafikprozessor (GPU) Grafikspeicher
(GDDR6)
Leistungsdaten[Anm. 1] MGCP
[Anm. 3]
Typ Aktive Einheiten Chiptakt
[Anm. 2]
Speicher-
größe
Speicher-
takt[Anm. 2]
Speicher-
interface
Rechenleistung
(in TFlops)
Füllrate Speicher-
bandbreite

(in GB/s)
ROPs SM ALUs Textur-
einheiten
Tensor-
Kerne
RT-
Kerne
Basis Boost 32 bit 64 bit Pixel
(GP/s)
Texel
(GT/s)
GeForce RTX 3050 Mobile 11. Mai 2021 GA107 40 16 2048 64 64 16 712 MHz 1057 MHz 04 GB 6000 MHz 128 Bit 4,33 0,07 42,3 67,7 192 75 W
GeForce RTX 3050 Ti Mobile 11. Mai 2021 48 20 2560 80 80 20 735 MHz 1035 MHz 04 GB 6000 MHz 128 Bit 5,29 0,08 49,7 82,8 192 75 W
GeForce RTX 3060 Max-Q 21. Feb. 2021 GA106 48 30 3840 120 120 30 817 MHz 1282 MHz 06 GB 6000 MHz 192 Bit 9,85 0,15 61,5 153,8 288 60 W
GeForce RTX 3060 Mobile 21. Feb. 2021 48 30 3840 120 120 30 900 MHz 1425 MHz 06 GB 7000 MHz 192 Bit 10,94 0,17 68,4 171 336 80 W
GeForce RTX 3070 Max-Q 12. Jan. 2021 GA104 80 40 5120 160 160 40 780 MHz 1290 MHz 08 GB 6000 MHz 256 Bit 13,21 0,21 103,2 206,4 384 80 W
GeForce RTX 3070 Mobile 12. Jan. 2021 80 40 5120 160 160 40 1110 MHz 1560 MHz 08 GB 7000 MHz 256 Bit 15,97 0,25 124,8 249,6 448 115 W
GeForce RTX 3070 Ti Mobile 4. Jan. 2022 80 44 5632 176 176 44 915 MHz 1410 MHz 08 GB 7000 MHz 256 Bit 15,88 0,25 112,8 248,2 448 115 W
GeForce RTX 3080 Max-Q 12. Jan. 2021 96 48 6144 192 192 48 780 MHz 1245 MHz 08 GB 6000 MHz 256 Bit 15,30 0,24 119,5 239 384 80 W
GeForce RTX 3080 Mobile 12. Jan. 2021 96 48 6144 192 192 48 1110 MHz 1545 MHz 08 GB 7000 MHz 256 Bit 18,98 0,30 148,3 296,6 448 115 W
GeForce RTX 3080 Ti Max-Q 25. Jan. 2022 GA103S 96 58 7424 232 232 58 585 MHz 1125 MHz 16 GB 6000 MHz 256 Bit 16,70 0,26 108 261 384 95 W
GeForce RTX 3080 Ti Mobile 25. Jan. 2022 96 58 7424 232 232 58 975 MHz 1395 MHz 16 GB 8000 MHz 256 Bit 20,71 0,32 133,9 323,6 512 175 W

Anmerkungen

  1. a b Die angegebenen Leistungswerte für die Rechenleistung über die Streamprozessoren, die Pixel- und Texelfüllrate, sowie die Speicherbandbreite sind theoretische Maximalwerte (bei Boosttakt), die nicht direkt mit den Leistungswerten anderer Architekturen vergleichbar sind. Die Gesamtleistung einer Grafikkarte hängt unter anderem davon ab, wie gut die vorhandenen Ressourcen ausgenutzt bzw. ausgelastet werden können. Außerdem gibt es noch andere, hier nicht aufgeführte Faktoren, die die Leistungsfähigkeit beeinflussen.
  2. a b c d Bei den angegeben Taktraten handelt es sich um die von Nvidia empfohlenen bzw. festgelegten Referenzdaten, beim Speichertakt wird der effektive Takt angegeben. Allerdings kann der genaue Takt durch verschiedene Taktgeber um einige Megahertz abweichen, des Weiteren liegt die finale Festlegung der Taktraten in den Händen der jeweiligen Grafikkarten-Hersteller. Daher ist es durchaus möglich, dass es Grafikkarten-Modelle gibt oder geben wird, die abweichende Taktraten besitzen.
  3. a b Der von Nvidia angegebene MGCP-Wert entspricht nicht zwingend der maximalen Leistungsaufnahme. Dieser Wert ist auch nicht unbedingt mit dem TDP-Wert des Konkurrenten AMD vergleichbar.
  4. Die in der Tabelle aufgeführten Messwerte beziehen sich auf die reine Leistungsaufnahme von Grafikkarten, die dem Nvidia-Referenzdesign entsprechen. Um diese Werte zu messen, bedarf es einer speziellen Messvorrichtung; je nach eingesetzter Messtechnik und gegebenen Messbedingungen, inklusive des genutzten Programms, mit dem die 3D-Last erzeugt wird, können die Werte zwischen unterschiedlichen Apparaturen schwanken. Daher sind hier Messwertbereiche angegeben, die jeweils die niedrigsten, typischen und höchsten gemessenen Werte aus verschiedenen Quellen darstellen.

Weblinks

Commons: Nvidia-GeForce-30-Serie – Sammlung von Bildern, Videos und Audiodateien

Einzelnachweise