GeForce RTX 4090 AI算力 1321 AI TOPS //RTX 5090/5090D/5080/4090详细参数对比

在最新公告中,GeForce RTX 40系列包括4090、4080 16GB和12GB三款产品,但12GB版本已在10月14日取消。关于GeForce RTX 4090,它是该系列的顶级型号,预计将沿用GeForce RTX 3090 Ti的供电和显存传输速率等规格,但通过减少工艺规则来增加CUDA核心数量,运行时钟也高于Radeon RX 6950 XT。目前进行的基准测试是在禁用可调整大小的BAR的情况下进行的,具体配置尚未详述。以上信息均来源于制造商的预先信息,最终规格可能会有所不同。

在9月20日(日本时间9月21日)的公告中,发布了GeForce RTX 4090和GeForce RTX 4080 16GB和12GB三款产品,而10月14日(日本时间10月15日)取消了12GB。在这里,我们总结了目前已知的GeForce RTX 40系列等规格。
*这是制造商等提供的预先信息。最终规格可能有所不同。

~GeForce RTX系列规格一览~

现在,我们来运行一下 GeForce RTX 40 系列的顶级型号 GeForce RTX 4090 的基准测试。为了进行比较,我们准备了GeForce RTX 30系列的GeForce RTX 3090 Ti和Radeon RX 6000系列的Radeon RX 6950 XT。测试分辨率为WQHD (2560 x 1440) 和4K (3840 x 2160)。此外,3D Mark还使用对CPU性能依赖性较小的图形分数进行比较。

*这是制造商提供的预先信息。实际产品可能有所不同。

粗略来说,GeForce RTX 4090可以说是沿用了GeForce RTX 3090 Ti的供电、显存传输速率等底盘规格,但通过减少工艺规则来大幅增加CUDA核心数量的型号。此外,运行时钟高于Radeon RX 6950 XT,无论是GPU核心数量还是运行时钟都适合新的高端型号。

此外,为了与过去的数据进行比较,我们在禁用可调整大小的 BAR 的情况下进行了基准测试。
*最后列出了基准测试中使用的配置。

Nvidia RTX 5090 vs 4090: Specs Comparison

SpecsNvidia GeForce RTX 5090Nvidia GeForce RTX 4090
ArchitectureBlackwell (GB202)Ada Lovelace
Fabrication ProcessTSMC N4P (4nm)TSMC 4N (5nm)
Transistors92 Billion76.3 Billion
CUDA Cores21,76016,384
Shader Cores125 TFLOPS83 TFLOPS
Tensor Cores5th Generation
3,352 AI TOPS
4th Generation
1,321 AI TOPS
Ray Tracing4th Generation
318 TFLOPS
3rd Generation
191 TFLOPS
Clock Speed2.01GHz (Base)
2.41GHz (Boost)
2.23GHz (Base)
2.52GHz (Boost)
DLSSDLSS 4DLSS 3/3.5
Memory32 GB GDDR724GB GDDR6X
Memory Bus512-bit384-bit
Memory Bandwidth1,792 GBps (1.8 TBps)1008 GBps (1 TBps)
TDP575W450W
Price$1,999$1,599
Release DateJanuary 2025October 2022

 

唯一的区别,就是Tensor AI算力,从满血的3352 TOPS降低到了2375 TOPS,损失幅度约29%,以符合美国的出口管制政策。

我们知道,DLSS、光追等技术都非常依赖Tensor核心加速,算力下来了是否会影响呢?

这个还要看后续的实际测试,不过从Nvidia官方给出的性能对比图来看,影响是非常小的,DLSS+光追全开的时候,只是可能在部分游戏中会有一点差距,比如说《黑神话:悟空》,大部分都没有变化。

另外,RTX 5090D虽然阉割了一部分AI算力,但对比RTX 4090/4090D仍然有很大的提升,尤其是RTX 4090D删减比较多,RTX 5090D比之的提升幅度,甚至大于RTX 5090对比RTX 4090。

RTX 5090不会有国行版本,自然也没有国行价格,所以我们无从判断RTX 5090D 16499元起是否就是RTX 5090应该有的价格。

那么,你觉得16499元的RTX 5090D值不值呢?

 

S2
S3

 

9月20日(日本時間9月21日)の発表では、GeForce RTX 4090、GeForce RTX 4080 16GB・12GBの3製品が公開され、10月14日(日本時間10月15日)に12GBがキャンセルされました。ここでは、現時点で判明している、GeForce RTX 40シリーズなどのスペックをまとめました。
※メーカー等による事前情報です。最終スペックと異なる場合があります。

GeForce
RTX 4090
GeForce
RTX 4080
GeForce
RTX 3090 Ti
NVIDIA
CUDAコア
16384972810752
ShaderコアAda Lovelace
83 TFLOPS
Ada Lovelace
49 TFLOPS
Ampere
40 TFLOPS
レイ
トレーシング
コア
第3世代
191 TFLOPS
第3世代
113 TFLOPS
第2世代
78 TFLOPS
Tensor
コア(AI)
第4世代
1321 AI TOPS
第4世代
780 AI TOPS
第3世代
320 AI TOPS
定格
クロック
2.23GHz2.21GHz1.56GHz
ブースト
クロック
2.52GHz2.51GHz1.86GHz
VRAM24GB
GDDR6X
16GB
GDDR6X
24GB
GDDR6X
メモリ
転送レート
21Gbps22.4Gbps21Gbps
メモリ
インター
フェイス幅
384ビット256ビット384ビット
メモリバス
帯域幅
1008GB/s716.8GB/s1008GB/s
TGP450W320W450W

~GeForce RTXシリーズ スペック一覧~

GeForce RTX 4090ベンチマーク情報

それでは、GeForce RTX 40シリーズの最上位モデルGeForce RTX 4090 のベンチマークを実行していきましょう。比較対象としては、GeForce RTX 30シリーズからGeForce RTX 3090 Ti、Radeon RX 6000シリーズからRadeon RX 6950 XTを用意しました。テスト解像度はWQHD(2560 x 1440)、4K(3840 x 2160) の解像度にて行っています。また、3D Markでは、CPU性能の依存度が少ないGraphics Scoreでの比較となります。

GeForce RTX
4090
GeForce RTX
3090 Ti
Radeon RX
6950 XT
アーキテクチャAda LovelaceAmpereRDNA 2
GPUコアAD102GA102Navi 21
製造プロセス4nm8nm7nm
CUDAコア16384基10752基5120基
RTコア
(Ray Accelerators)
第3世代
128基
第2世代
84基
80基
Tensorコア第4世代
512基
第3世代
336基
定格クロック2.23GHz1.67GHz未公開
ブーストクロック2.52GHz1.86GHz2310MHz
メモリタイプGDDR6XGDDR6
メモリ容量24GB16GB
メモリ転送レート21Gbps18Gbps
メモリバス幅384bit256bit
TDP(TBP)450W335W
補助電源12VHPWR ×1 or 8Pin×3(変換)8Pin×2
推奨電源850W850W

~スペック比較一覧~

※メーカーによる事前情報です。実際の製品では変更になる場合があります。

GeForce RTX 4090は、おおざっぱに言えばGeForce RTX 3090 Tiと電源周りやモリ転送レートなどの足回りの仕様は流用しつつ、プロセスルールの縮小によりCUDAコア数を大幅に強化したモデルと言えます。また、動作クロックについてもRadeon RX 6950 XTを上回っており、GPUコア数と動作クロックの両面において新しいハイエンドモデルに相応しい内容となっています。

なお、過去のデータと比較のためResizable BARについては無効としてベンチマークテストを行っております。
※ベンチマークテストで用いた構成は末尾に記載しています

来源

https://www.pc-koubou.jp/magazine/71236

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。