您好, 访客   登录/注册

64核心、128线程消费级处理器AMD锐龙Threadripper 3990X实战

来源:用户上传      作者:《微型计算机》评测室

  通过使用新的前端架构、改良浮点与整数运算单元以及采用7nm工艺生产,IPC提升了15%的Zen 2显然是近年来AMD最具威力的处理器架构。该架构不仅让定位王流的第三代锐龙处理器熠熠生辉,在2019年末,AMD还将它应用到了面向HEDT平台的AMD第三代锐龙Threadripper处理器上,并展示出了令对手难以企及的性能表现。32核心、64线程设计的锐龙Threadripper 3970XqSiSoftware Sandra中的算术性能达到1.1TOPS,是目前英特尔消费级处理器旗舰酷睿i9-10980XE的1.88倍;在《鲁大师》处理器性能测试中的分数突破70万分,单单一项处理器性能的分数就让很多电脑的整机测试分数望尘莫及。
  但AMD并不满足,通过对内部架构的巧妙设计以及Infinity Fabric总线、7nm生产工艺的助力,AMD在2020年终于推出了第三代锐龙Threadripper处理器的旗舰产品——拥有64核心、128线程配置的锐龙Threadripper 3990X。这也是消费级处理器首次佣有如此惊人的技术规格,甚至超过了很多服务器处理器。那么,将这么多的核心全部聚集在一起,它们是否能够同心协力发挥出“团战”的威力呢?对于用户而言,使用多达64颗核心的处理器又是怎样的体验?
  7nm Zen 2核心+8条Infinity Fabric总线直连针对专业人士设计的消费级旗舰
  首先需要指出的是,虽然锐龙Threadripper 3990X和其他锐龙Threadripper定位于消费级产品,但它们的应用环境与普通消费级处理器还是有所不同,主要针对的是对性能有很高要求的设计师、专业人士以及發烧友。它们不仅能帮助用户快速完成那些依赖处理器多核心性能的专业工作,还具备较强的游戏性能,也能给用户提供流畅的娱乐体验。与同级AMD ERYC霄龙处理器相比,锐龙Threadripper的工作频率更高,同时拥有超频能力、可以支持高频内存,因此它的单线程性能更强,也更适合运行游戏。不过,锐龙Threadripper不支持组建多路处理器系统,如果需要更强、更专业的多线程性能,AMD ERYC霄龙仍然是更好的选择。所以,虽然锐龙Threadripper比主流处理器的核心数量多得多,多线程性能强得多,但仍旧具备很多AMD主流处理器的特性,是一款兼具多线程与单线程性能的产品。
  采用Zen 2核心之后的第三代AMD锐龙Threadripper处理器拥有很多新特性,比如IPC提升了15%,支持PCIe 4.0总线技术以及对高频内存提供了支持。其官方标称最高内存支持频率就达到了四通道DDR4 3200(在只使用4根内存插槽时),即便8根内存插槽全部插满,内存容量达到256GB,它对内存的支持频率也可以达到DDR4 2667。鉴于Zen 2核心的具体改进之处我们曾在第三代锐龙处理器发布时进行过详细介绍,这里就不再赘述。下面我们主要谈谈第三代锐龙Threadripper处理器相对于上代产品其他的不同之处。
  首先是核心、线程数大幅提高。在第二代锐龙Threadripper处理器发布时,AMD还推出了多款12、16核心的产品,而随着7nm生产工艺的采用,现在主流锐龙平台的核心数量就已经达到了16颗。因此第三代锐龙Threadripper处理器的起步配置为24核、48线程设计的锐龙Threadripper 3960X,定位中端的产品为32核、64线程设计的锐龙Threadripper 3970X,本次将要测试的锐龙Threadripper 3990X则直接采用惊人的64核、128线程设计。当然在价格方面,锐龙Threadripper 3990X看起来也很高,其零售价为29999元,但对比14999元的18核心、36线程的酷睿i9-10980XE处理器,显然它的每核心成本并不贵。
  第二是工作频率大幅提高。同样得益于7nm工艺的采用、能耗比的提升,虽然第三代锐龙Threadripper处理器的核心数量有不小的增加,但锐龙Threadripper 3970X、锐龙Threadripper3960X的最高加速频率仍达到了4.5GHz。而锐龙Threadripper3990X的核心数量尽管达到了64颗,但其最高加速频率也有4.3GHz。当然,最高加速频率往往只应用在使用线程数较少的应用中,在与多线程应用相关的基础频率上,锐龙Threadripper3990X的基础频率还是明显低于其他两款产品,只有2.9GHz。原因很简单,在核心、线程数大幅增加的情况下,必须通过降低频率来降低处理器在多核心运算时的功耗、发热量。
  第三内部架构大幅变化。在上代Threadripper处理器架构中,它由纯计算核心与(计算+I/O)核心组成,后一种核心集成了内存控制器与PCIe控制器。这就造成纯计算核心在读写内存、PCIe设备时必须在(计算+I/O)核心中去寻找数据,这就意味着各计算核心访问内存、PCIe设备的延迟是不一样、不同步的。Zen 2架构的引入彻底将处理器核心和I/O模块分离,计算核心本身不再提供I/O接口而专注于运算,I/O模块成为连接各个计算核心和外部链接的中枢。如上页图例所示,在锐龙Threadripper3960X、3970X内部,它们拥有四颗CPU Complex Dies,也被称为CCD核心,每一颗CCD里包含6~8颗处理器核心。在四颗CCD的中间有一个总共集成64条PCIe 4.0控制器、四通道内存控制器的12nm I/O模块。每颗CCD都通过一条读取带宽为51.2GB/s,写入带宽25.6GB/s的Infinity Fabric总线即IFOP单元与I/O模块相连。这样设计的好处是每颗核心都可以直接访问PCIe设备、内存资源,每颗核心的级别、访问延迟相同,也就意味着各核心能更好地协同工作,释放出更多的性能。
  对于锐龙Threadripper 3990X来说,要达成64颗核心,显然需要8颗CCD核心,这又该如何排布呢?AMD在锐龙Threadripper 3990X发布之前早就展示过该处理器的一张实物照片——被开盖的锐龙Threadripper 3990X显示AMD在4颗CCD核心“身后”又增加了4颗CCD核心。可能很多人之前的猜想是AMD将之前连接4颗CCD的Infinity Fabric总线延长即可,增加的4颗CCD通过这4条总线与其他4颗CCD共同访问I/O模块。但这样设计意味着每16颗处理器核心要共同使用一条总线,而单条Infinity Fabric总线的带宽也就51.2GB/s,所以很可能会出现带宽不足的问题。同时这也意味着增加的32颗处理器核心无法直接访问内存、PCIe设备,延迟比前面的CCD高,再次出现上代Threadripper处理器各计算核心访问内存、PCIe设备延迟不同的问题,造成处理器计算效率降低。   因此AMD采用了一种巧妙的设计来解决这个问题,他们为锐龙Threadripper 3990X的I/O模块设计了8条Infinity Fabric总线。前面4个CCD核心还是通过总线直接连接I/O模块,而额外增加的4条Infinity Fabric总线则穿过前面的4个CCD核心与后面增加的4个CCD核心连接。这就实现了所有8个CCD、64颗处理器核心都能直接访问PCIe设备、内存资源。当然在距离上增加的这32颗核心距离I/O模块比原有的32核心要远一些,但由于电子的高速运动特性,影响应该很小。从本刊实测来看,AMD锐龙Threadripper 3990X处理器的内存与缓存延迟同锐龙Threadripper 3970X处理器相比没有明显区别,增加的4颗CCD、4条Infinity Fabric总线并未带来额外的延迟。值得一提的是每个CCD核心拥有39亿个晶体管,加上集成83.4亿个晶体管的12nm I/O模块,锐龙Threadripper 3990X的晶体管总数达到395.4亿个,而其硅片面积却只有1008平方毫米,TSMC 7nmFinFET工艺的使用功不可没。
  缓存方面,锐龙Threadripper 3990X还是保持了前两款产品的设计,每颗核心拥有512KB二级缓存、64KB一级缓存,每4颗处理器核心即一个CCX(Core complex)共享16MB三级缓存,因此锐龙Threadripper 3990X的缓存总容量达到(512KB×64+64KB×64)/1024+16MB×16=292MB。更大的缓存容量可以提高数据的命中概率,从而帶动处理器运算性能的提升,并减少内存访问延迟。
  此外,锐龙Threadripper 3990X处理器内的I/O模块也提供64条PCIe 4.0通道,其中56条可供用户使用。同时AMD也同步将主板芯片组升级为支持PCIe 4.0技术的TRX40,因此其总共拥有72条可用PCIe 4.0通道、12个USB 3.2 GEN2接口,可为用户提供多个M.2 SSD、PCIe 4.0×16显卡接口。值得一提的是,尽管锐龙Threadripper 3990X的核心数量、缓存容量大幅增加,但其TDP热设计功耗却与锐龙Threadripper 3970X、锐龙Threadripper 3960X完全相同,均为280W,那么它是怎么做到的呢?这是不是意味着它拥有更高的能耗比呢?接下来就让我们通过测试来揭开答案。只为不断超越专为64核心处理器打造的极致座驾:ROG ZENTH ⅡEXTREME ALPHA
  在AMD锐龙Threadripper 3970X发布时,ROO曾同时发布了一款高端TRX40芯片组主板:ROG ZENITH ⅡEXTREME。在我们为其豪华的16相供电、主动散热设计感到惊讶,以为这就是TRX40高端主板的终极产品时,没想到为了锐龙Threadripper 3990X,ROG又发布了一款升级版产品——ROG ZENITH Ⅱ EXTREME ALRHA。相对于ROG ZENITHⅡ EXTREME,ROG ZENITH Ⅱ EXTREME ALRHA在外观上的变化不大,主要升级在它的供电部分。首先考虑到第二代锐龙Threadrippe厂处理器高达280W的TDR热设计功耗,为了降低主板处理器供电电路的工作温度,这款主板也通过双双并联的设计达到了等效16相的规模。虽然在电感部分它依然使用16颗粉末化超合金电感,但在MOSFET部分,ROG ZENITHⅡ EXTREME ALRHA进行了升级,从ROG ZENITH ⅡEXTREME支持70A电流的Infineon TDA21472升级为支持90A负载的Infineon TDA21490。这也就意味着ROG ZENITHⅡ EXTREME ALPHA 16相供电电路理论上最高可支持高达1440A的电流,能轻松保证锐龙Threadripper 3990X处理器的正常工作,甚至是超频。从实际测试来看,在64核心的锐龙Threadripper 3990X满载运行半小时后,主板供电部分的最高温度也就68.9℃。
  其他方面,ROG ZENITH Ⅱ EXTREME ALPHA也采用了6 PIN+双8 PIN的ProCool Ⅱ高强度电源实心接口,其内部采用了更粗的CPU供电插针,主供电接口外部覆盖了金属装甲,从而降低阻抗与发热量,让电源的传输更有保障。散热方面,除了仍为MOSFET配备大型热管铝合金散热鳍片外,在散热片的中层结构中,它还内置了两个散热风扇。这样设计的目的很简单,除了主动散热可加速排出热量外,像电感这些不太方便安装散热片的元器件也可借助风扇产生的气流加速散热。
  内存供电上,该主板采用2+2相供电设计,每四根内存插槽就配备了由低内阻MOSFET、高磁导率合金核心电感组成的两相供电电路。此外主板还采用了OPTIMEM Ⅲ技术,该技术采用了独特的内存优化走线,能够提高信号完整性,减少干扰信号,提高内存兼容性和超频空间。这也使得ROG ZENITH Ⅱ EXTREMEALPHA主板的最高内存支持频率可达四通道DDR4 4733+,内存总容量最高可支持256GB,且可以使用ECC内存。
  同时ROG ZENITH Ⅱ EXTREME ALPHA主板也配备了由铝合金打造的ROG散热装甲,从I/O输出输入部分到M.2 SSD、PCH芯片组、音频部分,以及性能强劲的AquantiaAQC107 10G网卡,它们都——得到了ROG铝合金装甲的“庇护”。此外主板背板还配备了大面积的钢制背板,这不仅能让主板在搭载大型散热器、旗舰级显卡时不易变形,还能对主板元器件辅助散热,让主板工作得更加稳定。而大型散热模块加16相供电电路的使用,也让这款主板的重量直线攀升,达到了3公斤之多,算是主板里的“彪形大汉”了。
  ROG ZENITH Ⅱ EXTREME ALPHA主板不仅继续沿用了Aquantia的AOtion AQC107万兆有线网卡,更在无线部分搭配了支持最新WiFi 6技术(802.11ax)的英特尔AX200无线模块。其不仅支持5GHz/2.4GHz双频和多用户2×2 MIMO(MU-MIMO)技术,峰值传输带宽更达到2.4Gbps。同时用来显示系统温度、CPU频率、自检信息、风扇转速等信息的LiveDashOLED黑白显示屏在ZENITH Ⅱ EXTREME系列主板上也升级为“炫彩OLED”的1.77英寸OLED彩色显示屏。   其他方面,ROG ZENITH Ⅱ EXTREME ALPHA主板可以支持连接多达五块M.2 SSD,每个M.2 SSD的接口带宽均可达到最高PCIe 4.0×4即8GB/s。音频部分,ROG ZENITHⅡ EXTREME ALPHA主板也保持了ROG主板的最高水准,采用了高配的SUPREMEFX电竞信仰音效系统,其核心是一颗由瑞昱特供的S1220 Codec,该芯片提供了高达108dB信噪比(SNR)的音频输入和120dB信噪比的音頻输出水准。同时SUPREMEFX电竞信仰音效系统还为前置音频输出接口配备了—颗谐波失真(THD+N)仅-115dB的ESS ES9018Q2C整合式DAC/AMP (数模转换与放大)芯片。
  总体来说,在整体布局与功能设计、用料上,ROG ZENITHⅡ EXTREME ALPHA与ROG ZENITH Ⅱ EXTREME主板几乎完全相同,前者实质上就是后者的供电升级版。对于已经购买了ROG ZENITH Ⅱ EXTREME主板的用户而言,无需再升级主板,毕竟这款主板的技术规格也很强,由16颗InfineonTDA21472 Powerstage一体式封装MOSFET组成的16相供电系统也能支持高达1120A的电流,保证锐龙Threadripper3990X处理器的正常工作也是绰绰有余。
  测试点评:凭借64颗核心、128线程配置,锐龙Threadripper 3990X在多线程性能上显然可以轻松压制之前任何一款锐龙Threadripper处理器。与之前的锐龙Threadripper3970X相比,锐龙Threadripper 3990X01CPU Z处理器多线程性能领先了45%,其CINEBENC日R20处理器多核心渲染性能也领先了37.8%。它更成为《微型计算机》评测室首款在默认频率下就在《鲁大师》处理器测试中,突破100万分的产品。当然,由于其加速频率比锐龙Threadripper 3970X,锐龙Threadripper 3960XTEE,因此在处理器单线程性能上,它还是有所落后。此外,一些软件并不能很好地支持128线程并行计算,如从wPrime的测试来看,它最高只支持64线程计算,因此在这个测试中,锐龙Threadripper 3990X无法战胜锐龙Threadripper 3970X,屈居第二。
  测试点评:从我们有限的应用测试来看,目前对超多线程运算支持最好的还是3D图形渲染,它可以很好地调动128条线程同时运算,并带来非常好的效果。如在Blender中渲染一幅产品级单帧动画时,16核心设计的锐龙Threadripper 2950X需要花费1240秒,足足超过了20分钟。而锐龙Threadripper 3990X只需要6分38秒,比32核心的锐龙Threadripper 3970X都少用了4分33秒。同样,在3D设计常用的V-ray渲染器、Corona渲染器中,锐龙Threadripper 3990X也拥有最短的渲染时间,可以有效提高设计师的工作效率。而在其他应用中,锐龙Threadripper3990X也取得了领先,如在PCMark10电子表格计算性能、PCMark10图片编辑性能、SPECwpc NAMD分子模拟性能它都夺得头筹。毕竟在不少方程运算、图片滤镜处理中,程序能够很好地使用多线程运算资源,只是说可能无法完全利用128线程,因此优势不会太大。
  而在7-ZIP压缩与解压缩应用中,显然该软件可支持的最高线程数量也在64条左右,所以在这个测试中,锐龙Threadripper3990X也无法战胜锐龙Threadripper 3970X,位居第二。
  测试点评:接下来,我们还通过测试软件继续研究了128线程在哪些应用中可能取得优势。从AIDA64测试中可以看到,锐龙Threadripper 3990X显然非常适合用于AES加密计算。在该测试中,它一骑绝尘,AES加密速度明显领先于锐龙Threadripper 3970X,领先幅度达55.4%;在双精度光线追踪运算中,锐龙Threadripper 3990X也位居第一,运算速度领先锐XThreadripper 3970X 139.3%。同时在SiSoftware Sandra的财务分析(期权定价)运算,以及反映人工智能、机器学习性能的神经网络测试中,锐龙Threadripper 3990X的测试成绩也全面领先其他处理器。总体来说,在非常专业的应用中,锐龙Threadripper 3990X的64核心、128线程运算能力可以得到更好的发挥。
  处理器游戏性能测试
  测试点评:当然在工作之余,凭借Zen 2核心,以及比服务器处理器更高的工作频率,锐龙Threadripper 3990X也能提供给用户足够的游戏性能,在四款游戏中,它的游戏运行帧速与锐龙Threadripper 3970X、锐龙Threadripper 3960X非常接近。在《杀手6》中,尽管测试分辨率高达4K,但可以看到在这款严重依赖处理器性能的游戏里,几款处理器还是呈现出一定的差异——其中单核心性能最好的三款第三代锐龙Threadripper处理器在游戏中均领先第二代产品5~7fps,体现出了更好的游戏性能。
  锐龙Threadripper 3990X功耗与工作温度测试
  测试点评:功耗测试上,锐龙Threadripper 3990X带来了非常令人满意的结果。尽管在待机功耗上,锐龙Threadripper3990X的功耗与温度的确高出一截,但在同时开启CPU、FPU、CACHE的AIDA64烤机测试中,锐龙Threadripper 3990X在满载状态下的功耗只略高于锐龙Threadripper 3970X,温度反而比两款第三代锐龙Threadripper处理器还要低,64颗核心完全没有成为它在功耗与温度上的负担。这是为什么呢?   原因很简单,通过监控我们发现,锐龙Threadripper3990X在64核心长时间满载状态下的工作频率在2.9GHz~3.15GHz左右。而锐龙Threadripper 3970X的全核心满载频率在3.8GHz~3.9GHz左右,锐龙Threadripper 3960X的全核心满载频率在4.OGHza因此尽管锐龙Threadripper3990X的核心數多得多,但由于全核心满载频率低不少,所以它的功耗并不高,在温度控制上还更有优势。
  最高全核心3.8GHz锐龙Threadripper3990X超频能力测试
  测试点评:对一颗64核心处理器也要玩超频?要求会不会太过分了?事实上是锐龙Threadripper 3990X的确具备一定的超频能力。专业超频选手通过液氮对它进行极限超频的话,可将锐龙Threadripper 3990X的64颗核心最高超频到5.5GHz,CINEBENCH R20突破3万分。而对于使用水冷散热的普通用户来说,虽然达不到这样高的频率,但仍然可以体验这款处理器在高频率下的威力。
  在普通水冷散热环境下对锐龙Threadripper 3990XO}超频很简单,无需增加电压(因为在高电压、高频率下64核心处理器会释放出巨大的热量),只需要调节处理器的倍频即可。最终经我们多次尝试,锐龙Threadripper 3990X可完成CINEBENCH R20多核心渲染、V-RAY渲染测试,以及《鲁大师》处理器性能测试的最高稳定全核心频率为3.8GHz。可以看到,在这个频率下,处理器的CINEBENCHR20多核心渲染性能达到29000分,V-RAY渲染时间缩短至11秒,而其《鲁大师》处理器得分更突破120万分,在排名中稳居第一位,将其他处理器远远甩在身后。
  其他方面需要注意的是,超频时由于处理器频率的提升,锐龙Threadripper 3990X的功耗有大幅上升,超频后处理器满载运行的整机功耗(不含显示器)达到910W以上,因此如果你想要玩转64核心超频,那么选购一台1200W~1500W的电源是必不可少的。
  冲击高分纪录 欢迎来挑战
  鉴于锐龙Threadripper 3990X处理器超频后的分数非常惊人,因此我们还找来GeForce RTX 2080 Ti显卡、傲腾900PSSD等顶级硬件,在《鲁大师》5.20中进行了一次综合性能测试,看看采用锐龙Threadripper 3990X的整机系统能达到怎样的高度。同时为进一步提升分数,我们还对处理器进行了更高幅度的超频尝试——将处理器外频调节为101MHz,倍频仍然保持x38,即处理器频率达到3838MHz。
  结果令人瞠目结舌——综合性能总分突破168万分,具体数值为1686540,将也是采用锐龙Threadripper 3990X,但极有可能运行在默认频率下的第二名甩开了足足有20万分之多。原因很简单,这套整机系统的配件实在太强——运行在3838MHzT的锐龙Threadripper 3990X处理器分数提升到了1222554分,运行在默认状态下的GeForce RTX 2080 Ti,以及傲腾900PSSD也轻松击败其他99%的同类硬件。因此能取得如此高的综合性能分数也完全在情理之中。我们也欢迎大家向1686540这个分数发起挑战,早日在《鲁大师》综合性能测试中看到比这个分数更高的成绩。
  重新定义消费级处理器的上限
  从测试来看,毫无疑问,AMD锐龙Threadripper 3990XA是当今消费级处理器的王者——64核心、128线程发挥出的多线程性能将在很长时间内找不到对手,实际应用中能够有效提升各位设计师、专业人士的工作效率。而Zen 2架构核心、较高的加速频率则赋予了它不错的单线程性能,使得它也能胜任各类游戏娱乐,展现出消费级处理器应有的功能。对于预算充足,需要多线程性能,但不想使用或没必要使用多路服务器的专业用户来说,它就是目前消费级处理器中的唯一选择,毕竟竞争对手的同级消费级处理器核心数现在最高只有18颗。
  我们认为AMD锐龙Threadripper 3990X上市的另一重大意义是,重新定义了消费级处理器的性能上限。可以说除了不能组建多路系统外,锐龙Threadripper 3990X的出现意味着消费级处理器不论是在核心数量、工作频率还是最终性能上,与各款服务器处理器相比都是有过之而无不及。同时AMD锐龙Threadripper 3990X顶级处理器在设计过程中产生的各种技术经验、智慧成果也必将应用在其他产品上,带来消费级处理器的全面提升,这也意味着极有可能在今年下半年发布的AMD下一代Zen 3架构处理器将非常值得期待。
转载注明来源:https://www.xzbu.com/8/view-15261598.htm