GeForce RTX 4090 AI算力 1321 AI TOPS //RTX 5090/5090D/5080/4090详细参数对比
在最新公告中,GeForce RTX 40系列包括4090、4080 16GB和12GB三款产品,但12GB版本已在10月14日取消。关于GeForce RTX 4090,它是该系列的顶级型号,预计将沿用GeForce RTX 3090 Ti的供电和显存传输速率等规格,但通过减少工艺规则来增加CUDA核心数量,运行时钟也高于Radeon RX 6950 XT。目前进行的基准测试是在禁用可调整大小的BAR的情况下进行的,具体配置尚未详述。以上信息均来源于制造商的预先信息,最终规格可能会有所不同。
在9月20日(日本时间9月21日)的公告中,发布了GeForce RTX 4090和GeForce RTX 4080 16GB和12GB三款产品,而10月14日(日本时间10月15日)取消了12GB。在这里,我们总结了目前已知的GeForce RTX 40系列等规格。
*这是制造商等提供的预先信息。最终规格可能有所不同。
~GeForce RTX系列规格一览~
现在,我们来运行一下 GeForce RTX 40 系列的顶级型号 GeForce RTX 4090 的基准测试。为了进行比较,我们准备了GeForce RTX 30系列的GeForce RTX 3090 Ti和Radeon RX 6000系列的Radeon RX 6950 XT。测试分辨率为WQHD (2560 x 1440) 和4K (3840 x 2160)。此外,3D Mark还使用对CPU性能依赖性较小的图形分数进行比较。
*这是制造商提供的预先信息。实际产品可能有所不同。
粗略来说,GeForce RTX 4090可以说是沿用了GeForce RTX 3090 Ti的供电、显存传输速率等底盘规格,但通过减少工艺规则来大幅增加CUDA核心数量的型号。此外,运行时钟高于Radeon RX 6950 XT,无论是GPU核心数量还是运行时钟都适合新的高端型号。
此外,为了与过去的数据进行比较,我们在禁用可调整大小的 BAR 的情况下进行了基准测试。
*最后列出了基准测试中使用的配置。
Nvidia RTX 5090 vs 4090: Specs Comparison
Specs | Nvidia GeForce RTX 5090 | Nvidia GeForce RTX 4090 |
---|---|---|
Architecture | Blackwell (GB202) | Ada Lovelace |
Fabrication Process | TSMC N4P (4nm) | TSMC 4N (5nm) |
Transistors | 92 Billion | 76.3 Billion |
CUDA Cores | 21,760 | 16,384 |
Shader Cores | 125 TFLOPS | 83 TFLOPS |
Tensor Cores | 5th Generation 3,352 AI TOPS | 4th Generation 1,321 AI TOPS |
Ray Tracing | 4th Generation 318 TFLOPS | 3rd Generation 191 TFLOPS |
Clock Speed | 2.01GHz (Base) 2.41GHz (Boost) | 2.23GHz (Base) 2.52GHz (Boost) |
DLSS | DLSS 4 | DLSS 3/3.5 |
Memory | 32 GB GDDR7 | 24GB GDDR6X |
Memory Bus | 512-bit | 384-bit |
Memory Bandwidth | 1,792 GBps (1.8 TBps) | 1008 GBps (1 TBps) |
TDP | 575W | 450W |
Price | $1,999 | $1,599 |
Release Date | January 2025 | October 2022 |
唯一的区别,就是Tensor AI算力,从满血的3352 TOPS降低到了2375 TOPS,损失幅度约29%,以符合美国的出口管制政策。
我们知道,DLSS、光追等技术都非常依赖Tensor核心加速,算力下来了是否会影响呢?
这个还要看后续的实际测试,不过从Nvidia官方给出的性能对比图来看,影响是非常小的,DLSS+光追全开的时候,只是可能在部分游戏中会有一点差距,比如说《黑神话:悟空》,大部分都没有变化。
另外,RTX 5090D虽然阉割了一部分AI算力,但对比RTX 4090/4090D仍然有很大的提升,尤其是RTX 4090D删减比较多,RTX 5090D比之的提升幅度,甚至大于RTX 5090对比RTX 4090。
RTX 5090不会有国行版本,自然也没有国行价格,所以我们无从判断RTX 5090D 16499元起是否就是RTX 5090应该有的价格。
那么,你觉得16499元的RTX 5090D值不值呢?
9月20日(日本時間9月21日)の発表では、GeForce RTX 4090、GeForce RTX 4080 16GB・12GBの3製品が公開され、10月14日(日本時間10月15日)に12GBがキャンセルされました。ここでは、現時点で判明している、GeForce RTX 40シリーズなどのスペックをまとめました。
※メーカー等による事前情報です。最終スペックと異なる場合があります。
GeForce RTX 4090 | GeForce RTX 4080 | GeForce RTX 3090 Ti | |
---|---|---|---|
NVIDIA CUDAコア | 16384 | 9728 | 10752 |
Shaderコア | Ada Lovelace 83 TFLOPS | Ada Lovelace 49 TFLOPS | Ampere 40 TFLOPS |
レイ トレーシング コア | 第3世代 191 TFLOPS | 第3世代 113 TFLOPS | 第2世代 78 TFLOPS |
Tensor コア(AI) | 第4世代 1321 AI TOPS | 第4世代 780 AI TOPS | 第3世代 320 AI TOPS |
定格 クロック | 2.23GHz | 2.21GHz | 1.56GHz |
ブースト クロック | 2.52GHz | 2.51GHz | 1.86GHz |
VRAM | 24GB GDDR6X | 16GB GDDR6X | 24GB GDDR6X |
メモリ 転送レート | 21Gbps | 22.4Gbps | 21Gbps |
メモリ インター フェイス幅 | 384ビット | 256ビット | 384ビット |
メモリバス 帯域幅 | 1008GB/s | 716.8GB/s | 1008GB/s |
TGP | 450W | 320W | 450W |
GeForce RTX 4090ベンチマーク情報
それでは、GeForce RTX 40シリーズの最上位モデルGeForce RTX 4090 のベンチマークを実行していきましょう。比較対象としては、GeForce RTX 30シリーズからGeForce RTX 3090 Ti、Radeon RX 6000シリーズからRadeon RX 6950 XTを用意しました。テスト解像度はWQHD(2560 x 1440)、4K(3840 x 2160) の解像度にて行っています。また、3D Markでは、CPU性能の依存度が少ないGraphics Scoreでの比較となります。
GeForce RTX 4090 | GeForce RTX 3090 Ti | Radeon RX 6950 XT | |
---|---|---|---|
アーキテクチャ | Ada Lovelace | Ampere | RDNA 2 |
GPUコア | AD102 | GA102 | Navi 21 |
製造プロセス | 4nm | 8nm | 7nm |
CUDAコア | 16384基 | 10752基 | 5120基 |
RTコア (Ray Accelerators) | 第3世代 128基 | 第2世代 84基 | 80基 |
Tensorコア | 第4世代 512基 | 第3世代 336基 | – |
定格クロック | 2.23GHz | 1.67GHz | 未公開 |
ブーストクロック | 2.52GHz | 1.86GHz | 2310MHz |
メモリタイプ | GDDR6X | GDDR6 | |
メモリ容量 | 24GB | 16GB | |
メモリ転送レート | 21Gbps | 18Gbps | |
メモリバス幅 | 384bit | 256bit | |
TDP(TBP) | 450W | 335W | |
補助電源 | 12VHPWR ×1 or 8Pin×3(変換) | 8Pin×2 | |
推奨電源 | 850W | 850W |
※メーカーによる事前情報です。実際の製品では変更になる場合があります。
GeForce RTX 4090は、おおざっぱに言えばGeForce RTX 3090 Tiと電源周りやモリ転送レートなどの足回りの仕様は流用しつつ、プロセスルールの縮小によりCUDAコア数を大幅に強化したモデルと言えます。また、動作クロックについてもRadeon RX 6950 XTを上回っており、GPUコア数と動作クロックの両面において新しいハイエンドモデルに相応しい内容となっています。
なお、過去のデータと比較のためResizable BARについては無効としてベンチマークテストを行っております。
※ベンチマークテストで用いた構成は末尾に記載しています
来源
https://www.pc-koubou.jp/magazine/71236