NVIDIA GeForce RTX 4060 Testbericht

NVIDIA setzt seinen Weg mit der Ada-Lovelace-Architektur fort und erweitert mit den neu eingeführten Grafikkarten seine Produktpalette um Teilsegmente. Die Modelle RTX 4090, RTX 4080 und RTX 4070 Ti sowie RTX 4070 wurden vor einiger Zeit auf den Markt gebracht. Mit der günstigeren RTX 4060-Serie bringt der GPU-Riese jetzt die DLSS 3-Technologie zu Gamern.

Die GeForce RTX 4060 Ti 8 GB ist vor etwa einem Monat in den Handel gekommen, wir haben die Testberichte erstellt. Diesmal haben wir das Modell RTX 4060, das nicht den Zusatz „Ti“ trägt und über 8 GB VRAM in gleicher Form verfügt. Mit anderen Worten: Wir testen das günstigste verfügbare Mitglied der RTX 4000-Familie. Es ist nicht bekannt, wann die RTX 3050 eintreffen wird, aber wir möchten Sie noch einmal daran erinnern, dass xx60-Grafikkarten immer sehr gefragt sind.

Wenn Sie sich erinnern, war die RTX 3060 mit 12 GB Speicher ausgestattet. Sein Vorgänger verfügt über 4 GB Speicher mit geringerer Kapazität, was viele Menschen ansprechen wird. Bemerkenswert ist, dass NVIDIA mit der neuen Ada Lovelace-Architektur wertvolle Verbesserungen auf der Cache-Seite vorgenommen hat. Darauf werden wir in Kürze noch ausführlicher eingehen.

Ein weiterer Punkt ist der Stromverbrauch. In Sachen Energieeffizienz sieht die RTX 4060 wirklich gelungen aus. Die RTX 3060 war eine 170-W-Grafikkarte, während die RTX 4060 TGP-Kosten (Total Card Power) von 115 W hat. NVIDIAs Hand wird stärker, wenn auch die DLSS 3-Technologie im Spiel ist.

Die RTX 4060 wird mit der im Mai erschienenen Radeon RX 7600 konkurrieren. Wir haben uns zuvor die Leistung der RX 7600 angeschaut und einige Vergleiche mit der RTX 4060 Ti angestellt. Über diesen Kontakt können Sie auf alle Leistungsnummern zugreifen.

Die Karte des unteren Mittelklassesegments von NVIDIA verfügt über eine deutlich bessere Raytracing-Leistung und DLSS 3-Vorteile als ihr Konkurrent. In Bezug auf die Rasterisierungsleistung kann NVIDIA in einigen Fällen die Nase vorn haben, in anderen Fällen AMD. Wenn wir uns schließlich die RTX 4060 und RX 7600 ansehen, können wir sagen, dass die grüne Gruppe den Vergleich gewonnen hat.

Ohne DLSS 3 wird es hinsichtlich der GPU- und Speicherleistung keine großen Leistungsunterschiede zwischen der RTX 3060 und der RTX 4060 geben. Laut NVIDIA ist die RTX 4060 Ti ohne Frame Gen (DLSS 3) nur 15 % schneller als die RTX 3060 Ti. So gibt es nach eigenen Angaben im Mittelfeld zwischen RTX 4060 und RTX 3060 einen Unterschied von etwa 20 %.

Wie erwartet setzt NVIDIA wieder auf den Joker von DLSS 3 und stellt diese Technologie häufig in seinen Präsentationen vor. Grüner Rahmen, mit aktiver Frame-Generierung RTX 4060‚von RTX 3060Es gibt an, dass es 70 % schneller ist als das .

Die RTX 4060 hat ungefähr das gleiche Leistungsniveau wie die RTX 3060 Ti der vorherigen Generation. Es gibt jedoch einen großen TGP-Unterschied zwischen 200 W und 115 W. Darüber hinaus möchten wir Sie daran erinnern, dass die RTX 4060 mit einem Preis von 299 US-Dollar günstiger ist.

Wir teilen auch die Ergebnisse unserer unabhängigen Tests mit Ihnen. Fügen wir unten auch die von NVIDIA durchgeführten Vergleiche hinzu. Wenn Sie in der Tabelle ein Spiel sehen, bei dem die RTX 4060 einen großen Unterschied macht, gibt es dort auch DLSS 3.

1080p Technologie RTX 1060 RTX 2060 RTX 3060
12 GB
RTX 4060 8 GB 4060 vs.
3060
4060 vs.
2060
Assassin’s Creed ValhallaOhne RTX44,074,090,0110,022 %%49
Tom Clancys Division 2Ohne RTX41.674.286.1101,718 %37 %
Red Dead Redemption 2DLSS 225.154,565,876,316 %40 %
Call of Duty: Contemporary Warfare IIDLSS 233,081,0101,0137,036 %69 %
Horizon Zero DawnDLSS 250,0110,0131,0150,015%36 %
Gott des KriegesDLSS61.473.181,5%1133 %
Der Letzte von uns, Teil 122.850.177,691.117 %82 %
Resident Evil-RemakeOPS46.463,877,521 %67 %
KontrolleRT, DLSS29.871,593,6105.1%1247 %
Far Cry 6RT75,090,0109,021 %45 %
Marvels Guardians of the GalaxyRT, DLSS271.297,0113,016 %59 %
Metro ExodusRT, DLSS211.751,559,874,825 %45 %
Schatten des Tomb RaiderRT, DLSS22.968,5100.1124.224 %81 %
Watch Dogs LegionRT, DLSS29.431.549.962,525 %98 %
Forza Horizon 5DLSS 325.044,080,0136,070 %209 %
Cyberpunk 2077 PTPT, DLSS 316.226.758.3118 %260 %
Portal RTXPT, DLSS 313.326.261,8136 %365 %
Dying Light 2 Bleib menschlichRT, DLSS 358,778,0130,768 %123 %
Eine Pestgeschichte: RequiemOPS741,045.687,391 %113 %
Cyberpunk 2077 RT UltraRT, DLSS 339,554.697,178 %146 %
F1 ’22RT, DLSS 374,092,0139,051 %88 %
Hitman 3RT, DLSS 369,391,6139,652 %101 %
Hogwarts-VermächtnisRT, DLSS 36.662,077,5123,659 %99 %
Microsoft-FlugsimulatorDLSS 331.873,473,0139.191 %90 %
Spider-Man Miles MoralesRT, DLSS 349,069,9114,063 %133 %
The Witcher 3: Wild HuntRT, DLSS 33.223.734.759,872 %152 %
Warhammer 40K: DarktideRT, DLSS 335,047,788,385 %152 %

Im Gegensatz zu den Ti-Modellen wird die RTX 4060 von der AD107-GPU statt von der AD106 angetrieben. Der Grafikchip im unteren Segment ist mit 158,7 mm² kleiner.

Die SM-Größe sinkt von 34 auf 24, und im Kontakt damit sinkt die Anzahl der CUDA-Kerne von 4352 auf 3072. Die Anzahl der mit SM-Einheiten verbundenen Tensor- und RT-Kerne verringerte sich natürlich auch. Wir werden wahrscheinlich eine andere Variante derselben GPU im RTX 3050-Modell sehen.

Der jüngere Bruder des 4060 Ti, der RTX 4060, verfügt über 24 MB L2-Cache statt 32. Rohbandbreite 272 GB/s etwas niedriger als beim 4060 Ti. Aber aktive Bandbreite dank 24 MB L2-Cache 453 GB/s ausgehen. AMD hatte mit der RDNA-2-Architektur auf die Infinity-Cache-Cache-Technologie umgestellt. Diese Technologie hat wertvolle Vorteile gebracht, und NVIDIA hat einen ähnlichen, wenn auch nicht genauen Ansatz gewählt.

Die RTX 4060, die mit der Radeon RX 7600 konkurrieren wird, wird mit einem TGP-Preis von nur 115 W gelistet, was ausgezeichnet ist. Auch die Leistungskosten und der Beitrag von DLSS 3 sind sehr wertvoll. Wenn wir uns einen Überblick verschaffen, scheint AMDs Aufgabe immer schwieriger zu werden.

Andererseits sollten wir die Vorteile von DLSS 3 nicht außer Acht lassen. Mit anderen Worten: Nicht alles dreht sich um theoretische Zahlen. Erinnern wir uns noch einmal daran. Die DLSS 3-Technologie wird derzeit nur von der Ada Lovelace-Architektur, nämlich der RTX 4000-Serie, unterstützt. GeForce RTX 4060 verfügt über neue Funktionen wie DLSS 3, SER (Shader Execution Reordering), DMM (Displacement Micro-Meshes) und OMM (Opacity Micro-Maps). All dies kann je nach Spiel zu enormen Leistungssteigerungen führen.

Ada Lovelace-Architektur und Cache-Verbesserungen

Das in der RTX 4060 implementierte Ada-Speichersubsystem unterscheidet sich von früheren Architekturen durch seine 24 MB L2-Cache-Größe. Die hohe Cache-Kapazität reduziert den Datenverkehr auf dem Speicherbus und bietet so die effizienteste Kombination aus Leistung und Energieeffizienz für 1080p-Gaming.

Alle Rechenprozesse finden auf GPU-Kernen statt. Damit die Kernel schnell arbeiten können, müssen sie schnell und effizient auf die Daten zugreifen können. Hier kommt der L1-Datencache der GPU ins Spiel. Jeder SM (Stream Multiprocessor) innerhalb der GPU enthält einen L1-Datencache mit erstaunlich geringer Latenz, der sich schnell neben den Prozesskernen befindet, sodass L1 die erste Wahl ist, wenn die GPU nach Informationen sucht. Der L1-Cache muss sehr nahe an den Kernen liegen und darf daher nicht groß sein.

Sollten die zur Verarbeitung der Kerne benötigten Daten nicht im L1-Cache zu finden sein, greift die GPU im nächsten Schritt auf den L2-Informations-Cache zurück. Dieses Speichersystem befindet sich auf dem GPU-Chip und ist über ein sehr schnelles Crossbar-System mit allen GPCs (Graphic Process Clusters) verbunden, die jeweils mehrere SMs enthalten. Wenn die Informationen im L2-Cache gefunden werden (Cache-Treffer), werden die Informationen abgerufen und sofort an die Kerne gesendet.

Werden die Informationen nicht im L2-Cache gefunden (Cache-Miss), muss die GPU über die Speicherschnittstelle zum VRAM gelangen. Dieser Prozess erzeugt zusätzlichen Datenverkehr im Speichersubsystem, wodurch Leistung und Energieeffizienz verringert werden.

Auf Ada-GPUs wurden deutlich größere L2-Caches bevorzugt. Im Vergleich zur Ampere-GPU, die auf dem 128-Bit-Bus läuft, bietet die L2-Cache-Architektur eine 16-fache Kapazitätssteigerung. Darüber hinaus wurde die L2-Cache-Bandbreite auf Ada-GPUs im Vergleich zu früheren GPUs deutlich erhöht. Auf diese Weise können schnellstmöglich mehr Informationen zwischen den Kernen und dem L2-Cache übertragen werden. Der größere L2-Cache von Ada sorgt für deutlich mehr L2-Cache-Treffer und reduziert gleichzeitig den Verkehr auf dem Speicherbus.

RTX 4060 TiRTX 4060 Ti 16 GBRTX 4060RTX 3060 TiRTX 3060RTX 2060 SUPERRTX 2060
Architektonisch106 n. Chr106 n. Chr107 n. ChrGA104GA106TU106TU106
Produktion
Technologie
TSMC 4NTSMC 4NTSMC 4NSamsung 8NSamsung 8NTSMC 12FFNTSMC 12FFN
Transistor22,9 Milliarden22,9 Milliarden18,9 Milliarden17,4 Milliarden12,0 Milliarden10,8 Milliarden10,8 Milliarden
Chipgröße187,8 mm²187,8 mm²158,7 mm²392,5 mm²276 mm²445 mm²445 mm²
SM34342438283430
CUDA-Kern4352435230724864358421761920
Tensorkern13613696152112272240
RT-Kern34342438283430
Taktfrequenz2535 MHz2535 MHz 2460? MHz1665 MHz1777 MHz1650 MHz1680 MHz
Speichergeschwindigkeit18 Gbit/s18 Gbit/s17 Gbit/s14 Gbit/s15 Gbit/s14 Gbit/s14 Gbit/s
Speicherkapazität8 GB16 Gigabyte8 GB8 GB12 GB8 GB6 GB
Bandbreite128-Bit128-Bit128-Bit256-Bit192-Bit256-Bit192-Bit
L2-Cache32 MB32 MB24 MB4 MB3 MB4 MB3 MB
KITTEL48483280486448
TMU13613696152112136120
TFLOPS FP32 (Boost)22.122.11516.212.77.26.5
TFLOPS FP16 (FP8)177 (353)177 (353)121 (242)130 (intermittierend)102 (intermittierend)5752
Bandbreite288 (554 effektiv) GB/s288 (554 effektiv) GB/s272 (453 effektiv) GB/s448 GB/s360 GB/s448 GB/s336 GB/s
TGP160W160W115W220W170W175W160W
VeröffentlichungsdatumMai 2023Juli 2023Juli 2023Dezember 2020Februar 2021Juli 2019Januar 2019
Listenpreis399 $499 $299 $399 $329 $399 $349 $

Der TGP-Wert stellt die obere Leistungsgrenze für GPU Boost dar. Karten erreichen normalerweise nicht ganz das TGP-Ende, Anwendungen mit hohem Stromverbrauch können in plausiblen Szenarien die TGP-Grenze überschreiten. In einigen Fällen können die GPU-Taktraten maximiert werden, wodurch die Effizienz der GPU maximiert wird.

Wir haben erwähnt, dass die RTX 4060 in puncto Effizienz erfolgreich war. Hier sind die von NVIDIA erstellten Metriken:

RTX 2060 RTX 3060 12 GB RTX 4060
Leerlauf8W8W7W
Beim Abspielen von AV1-Bildern14W13W11W
Durchschnittlich in Spielen138W170W110W
TGP160W170W115W

Zusammenfassend lässt sich sagen, dass der Stromverbrauch in vielen Betriebsbedingungen, insbesondere in Spielen, weit unter der Obergrenze liegt. Wie die GeForce RTX 4060 Ti liegt auch die RTX 4060 in Spielen unter ihrem maximalen TGP:

Spiel 1080p
Far Cry 697W
Forza Horizon 595W
Beschützer der Galaxis105W

DLSS 3 wird als revolutionärer Durchbruch in der KI-gesteuerten Grafik beschrieben, der die Leistung erheblich verbessert und gleichzeitig die Bildqualität und Reaktionsfähigkeit beibehält. Der DLSS Frame Generation Autoencoder verarbeitet vier Schlüsseldaten: aktuelle und vorherige Spielframes, ein optisches Flussfeld, das vom Optical Flow Accelerator der Ada-Architektur erzeugt wird, Spiel-Engine-Daten wie Bewegungsvektoren und Tiefe.

Der Optical Flow Accelerator analysiert zwei aufeinanderfolgende In-Game-Frames und führt eine Berechnung der optischen Flussfläche durch. Das optische Flussfeld erfasst die Richtung und Geschwindigkeit, mit der sich die Pixel von Bild 1 zu Bild 2 bewegen. Der optische Flussbeschleuniger ist in der Lage, Informationen auf Pixelebene wie Partikel, Reflexionen, Schatten und Beleuchtung zu erfassen, die nicht in der Spiel-Engine enthalten sind Bewegungsvektorberechnungen. Im Motorradbeispiel unten stellt der Bewegungsfluss des Motorradfahrers genau den Schatten dar, der relativ zum Motorrad ungefähr an Ort und Stelle auf dem Bildschirm bleibt.


Optical Flow Accelerator verfolgt Effekte auf Pixelebene wie Reflexionen in realer Form, während DLSS 3 auch Bewegungsvektoren der Game Engine verwendet, um die Bewegung der Geometrie in der Szene präzise zu verfolgen. Im folgenden Beispiel wird gezeigt, dass die Bewegungsvektoren des Spiels der Bewegung der Straße, die am Motorradfahrer vorbeifährt, genau folgen (aber keine Schatten bilden). Das Erstellen von Bildern, bei denen nur Motorbewegungsvektoren verwendet werden, führt zu visuellen Anomalien, wie z. B. Rauheit im Schatten.


Das DLSS Frame Generation AI-Netzwerk entscheidet, wie Informationen aus Spielbewegungsvektoren, optischen Flussfeldern und sequentiellen Spielbildern verwendet werden, um Mittelbilder für jedes Pixel zu generieren. Dieses Netzwerk kann sowohl Geometrie als auch Effekte genau reproduzieren, indem es sowohl motorische Bewegungsvektoren als auch den optischen Fluss (wie im Foto unten zu sehen) zur Bewegungsverfolgung nutzt.

Die KI rekonstruiert drei Viertel des ersten Frames, wenn DLSS 3 aktiviert ist, und den gesamten zweiten Frame mithilfe der DLSS Frame Generation. Wie bereits erwähnt, werden sieben Achtel der insgesamt angezeigten Pixel neu konfiguriert, was einen großen Beitrag zur Leistung leistet.

  • Neues Streaming-Multiprozessor-Design (SM).: Die neuen SM-Geräte bieten bis zu 2-fache Leistung und Energieeffizienz.
  • Tensorkerne der 4. Generation und optischer Fluss: Aktivierte und verbesserte wertvolle KI-Technologien, einschließlich NVIDIA DLSS 3, was die Bildraten erhöht.
  • RT-Kerne der 3. Generation: Die Raytracing-Leistung erhöht sich um das bis zu Zweifache.
  • Neues Inselspeicher-Subsystem: Die Ada Lovelace-Architektur bietet eine wertvolle Steigerung des L2-Cache, was zu besserer Leistung, weniger Speicherbusverkehr und größerer Energieeffizienz führt.
  • Neuordnung der Shader-Ausführung (SER): SER verbessert Raytracing-Prozesse um das Doppelte, erhöht die FPS und sorgt für eine Steigerung von bis zu 44 % im Cyberpunk: Overdrive-Modus.
  • DLSS 3: Im Wesentlichen kann die DLSS 3-Technologie, mit der Sie vertraut sind, die FPS-Raten in Spielen um ein Vielfaches steigern.
  • NVIDIA Studio: Überlegene Leistung im 3D-Prozess, Bildbearbeitung und Live-Übertragung.
  • AV1-Encoder: – NVIDIA-Encoder der 8. Generation (NVENC) mit AV1-Boost, 40 % effizienter im Vergleich zu H.264.

Ähnliche Beiträge

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert