当前位置:首页 > 数码 > 释放CPU与内存性能桎梏的终极解决方案-NUMA架构 (释放cpu性能)

释放CPU与内存性能桎梏的终极解决方案-NUMA架构 (释放cpu性能)

admin5个月前 (04-14)数码39

简介

NUMA(Non-Uniform Memory Access)是一种计算机架构,其中每个处理核心或处理器都拥有自己的本地内存。与统一内存访问(UMA)架构不同,在 UMA 架构中,所有处理器共享一个公共内存池,在 NUMA 中,处理器只能直接访问其本地内存。这会导致访问其他节点内存的延迟增加,从而影响性能。

优点

  • 减少内存争用:由于每个处理器都有自己的本地内存,因此访问本地内存时不会与其他处理器发生争用,从而提高了性能。
  • 可扩展性:NUMA 架构易于扩展,可以通过添加额外的节点来增加内存容量和处理能力,从而满足不断增长的需求。
  • 成本效益:与 UMA 架构相比,NUMA 架构通常更具成本效益,因为每个节点只需要支持自己的本地内存。

缺点

  • 内存不均衡:在 NUMA 系统中,如果程序的数据分布不均匀,可能会导致访问远程内存延迟增加,从而影响性能。
  • 数据管理复杂:NUMA 系统需要操作系统和应用程序更智能地管理数据分布和迁移,以确保内存访问的均衡性,增加了复杂性。
  • 硬件和软件兼容性:NUMA 架构需要特定的硬件支持和软件优化,以充分利用其优势,否则性能可能会受到影响。

解决方案

  • 内存亲和性:内存亲和性技术可以确保程序尽可能访问本地内存,减少访问远程内存的次数。
  • 高速互连技术:高速互连技术,如高速总线和网状网络,可以减少跨节点访问内存的延迟。
  • 软件优化:操作系统和应用程序可以通过优化内存访问模式和数据分布来提高 NUMA 系统的性能。

应用

NUMA 架构广泛应用于高性能计算(HPC)、数据中心和企业服务器等领域。它特别适用于大内存容量和高处理能力要求的应用。

结论

NUMA 架构是一种提供高性能和可扩展性的计算机架构。虽然它带来了一些挑战,但可以通过技术和策略来解决这些挑战。NUMA 架构在不断发展,随着硬件和软件的进步,其潜力将得到进一步释放。

ROG魔霸7 Plus超能版评测:首搭锐龙9 7945HX处理器,媲美台式机的性能怪兽

AMD在今年宣布了锐龙7045HX系列移动处理器后,顶 级旗舰型号的锐龙9 7945HX处理器也终于落地,并在ROG魔霸7 PLUS超能版上搭载,相比混合异构架构的13代英特尔酷睿处理器,采用Zen 4架构、5nm制程的锐龙7045HX系列,拥有16核心32线程的全大核设计,总数高达80MB的二三级缓存,标称基础功耗55W最 高可以释放到120W,加速频率高达5.4GHz,即便是此前配备在台式机上的同系列也是顶 级性能,如今用在移动设备上,优秀的能耗比得到发挥,堪称珠联璧合,绰有余裕。此外,ROG魔霸7 PLUS超能版还配备了175W满功耗RTX 4090笔记本电脑GPU,采用17.3英寸2.5K 240Hz的电竞屏,是高端游戏玩家具有极 佳体验的性能怪兽。

欣喜的是,我们现在拿到了ROG魔霸7 PLUS超能版,到底AMD锐龙9 7945HX处理器的实力如何,能不能成为游戏本界的霸主,相信数据会说明一切。首先从ROG魔霸7 Plus超能版的外观开始吧。

一、 ROG元素+RGB灯效 游戏玩家的激情信仰

对比上一代,ROG魔霸7 Plus超能版在模具及部分细节上有所升级,比如在机身底部新增了荧光绿铭牌,上有“Back On Top”字样,更显潮酷运动风;还在全系标配了高清摄像头等。全新的ROG魔霸7 Plus超能版采用了“潮魂黑”的配色,A面金属材质,ROG信仰LOGO在开机后可以自动变换色彩或者与键盘、底盘U型灯进行神光同步。

上盖采用了悬浮设计,机身后部留有“小尾巴”,也是散热和接口的主要区域。值得一提的是,作为ROG家族产品,ROG元素也融入到了产品的设计中,比如机身后部散热出风口的MMVI,对应了罗马数字中的2006,也是ROG成立的年份。

机身底部除了“Back On Top”,还有FOR THOSE WHO DARE字样,以及由数字组成的彩蛋,包括在机身内部的均热板上,都有很多的ROG元素,可见ROG是有多么宠粉儿。

接口方面主要集中在背部,包括2个USB 3.2 Gen2 Type-C接口(均支持DP 1.4和G-SYNC,其中一个还支持100W PD充电),1个HDMI 2.1(8K 60Hz/4K 120Hz输出),1个2.5G RJ45有线网络接口,以及圆形的电源接口,配备了一个330W的电源适配器。

机身左侧2个USB 3.2 Gen1 Type-A接口,1个3.5mm音频接口,机身右侧仅有散热格栅。如果能把USB 3.2 Gen1 Type-A设置在左右各一个,或者在右侧再增加一个,肯定更加方便连接。

开机后最明显的就是机身底部的U型灯效,以及RGB键盘,玩家可以通过控制中心进行个性化设置或神光同步,使其更具电竞氛围感。

ROG魔霸7 Plus超能版的键盘支持单键RGB背光,并设计了独立分区的快捷键,配备了独立的数字小键盘区。2mm的超长键程,打字、游戏的按压都更有段落感,而且具有的Overstroke闪击技术,可以得到快速响应,让你能够随时手跟心动,快速打字不手滑。

二、2.5K 240Hz高清高刷新率电竞屏

ROG魔霸7 Plus 超能版搭配了17.3超大尺寸的IPS高清高刷新率电竞屏,采用三面窄边框设计,拥有2.5K分辨率、240Hz刷新率、3ms响应延时,具有100% P3色域覆盖、支持杜比视界,相比较传统的屏幕,无论是亮度还是色彩的明艳度、逼真效果等,都要更好。更高的刷新率以及G-SYNC同步,让游戏更加丝滑流畅,不会出现画面撕裂、拖影等现象。

使用红蜘蛛校色仪实测屏幕色域,结果可见,100%sRGB,100%的P3,87%的NTSC。可以满足日常专业作图、设计等的需求。

色彩准确度方面,Dlelta E 最大值1.62,平均值0.5(标准≤2,越小越好)。

三、Armoury Crate奥创智控中心

Armoury Crate奥创智控中心是ROG设备的集中管理中心,通过界面左侧的菜单可以导航至状态监控和应用设置,以及对ROG设备的设置,包括资源管理、灯效与同步、游戏管理等,是玩家个性化笔记本的必备应用。

需要说明的是,本文硬件评测的跑分项目,均在Armoury Crate的增强模式、独显输出模式下进行,虽然手动模式可以进一步增强CPU、GPU的性能,但是同时也会带来更高的功耗、更高的温度和更大的风扇噪音,而且由于超频的不确定因素,还是会存在一定风险,所以不推荐大家在不熟悉的情况下使用手动方式去调整参数。

四、AMD锐龙9 7945HX:媲美桌面旗舰处理器的性能

AMD锐龙9 7945HX处理器,Zen 4架构,TSMC 5nm FinFET工艺,16核心32线程,全大核设计,二级缓存16MB、三级缓存64MB,基础功率2.5GHz,最大时钟频率5.4GHz,热设计功耗TDP55W,集成RDNA 2核心的Radeon 610M显卡,显卡频率2200MHz,支持内存类型DDR5 5200,主要用于有极 致性能需求的移动设备上搭载。

锐龙9 7945HX处理器采用了全新一代的Zen 4架构,全大核设计,并且用上与台式机处理器几乎完全一样的小芯片(Chiplet)技术,通过对电压的调优,可以在低功耗水平下实现更高性能的运行。与13代英特尔酷睿i9-HX旗舰级处理器对比,尽管在最大频率上低了0.2GHz,但是其在功耗和能效方面均有超越,在游戏、内容创作等的体验上也是相当强悍。

首先我们来看看锐龙9 7945HX处理器在ROG魔霸7 Plus超能版笔记本上的实际功耗表现,增强模式下,使用AIDA64的FPU模式进行测试,可以看到其功耗曲线相当平稳,完全没有温度墙的限制,更没有像酷睿处理器在跑功耗时的大起大落,在连续运行15分钟后可见,CPU封装功耗111W,温度87.1℃,频率也稳定在4GHz,相当给力。

整机功耗方面,由于ROG魔霸7 Plus超能版还搭配了RTX 4090笔记本电脑GPU,所以我们除了使用AIDA64的FPU模式,还加入了FurMark显卡烤机同时进行,FurMark分辨率1080,2X抗锯齿,同样运行15分钟后,CPU功耗稳定输出在55、56W,温度87.6°C,GPU功耗为175W+满功耗,温度78.8°C。由此可见,ROG魔霸7 Plus超能版的整机功耗可以达到230+W,而且相当稳定,如果解锁手动模式,整机功耗可以提升至240W而无悬念,这让我们对之后的跑分测试充满信心。

通过上面的烤机测试,除了具有稳定的功耗输出,还可以看到无论是CPU还是GPU的温度都非常低,尤其是作为旗舰级的锐龙9 7945HX处理器,其在功耗与能效方面的优化优势,也再次体现出来。当然,这也离不开笔记本优秀的散热设计。

ROG魔霸7 Plus超能版采用了新一代冰川散热架构2.0增强版解决方案,拆机可见,核心区域采用了均热板导热,底下是5热管设计,双风扇四出风口,同时还在CPU、GPU覆盖了第二代液金,导热效率更高,降温明显。

来看看理论跑分情况。

3DMark CPU跑分

作为针对CPU性能的跑分测试,3DMark CPU从单线程、双线程到最大线程,分别给出成绩,同时还能验证CPU的稳定性。锐龙9 7945HX处理器的最大线程得分达到了,目前来说基本上是天花板级别的存在。

·CINEBENCH

CINEBENCH是CPU性能测试的常用平台,通过内置的Cinema 4D特效引擎来评价CPU和性能。结果可见,锐龙9 7945HX处理器在CINEBENCH R15上的单核得分301cb,多核得分5608cb;R20测试单核得分732pts,多核得分pts;R23测试单核得分1894pts,多核得分pts。

·GeekBench 6

Geekbench的新版测试平台中,可以通过实用的日常场景和数据集来衡量处理器性能,并给出CPU单核、多核成绩。测试结果可见,锐龙9 7945HX处理器在Geekbench 6平台上的单核成绩为2681,多核成绩。

·7-Zip 基准测试

7-Zip是一款常用的压缩/解压缩工具软件,其内置的基准测试能够用于PC的性能评估。通过10轮压缩解压缩的测试,总体评分达到178.429 GIPS,同样傲视其它型号的处理器。

·X264 FHD Benchmark 视频编解码

日常办公中,视频格式的转换能够反映PC的性能表现。在X264 FHD Benchmark的测试中,编解码的帧率达到97.04 FPS,渲染时间为26秒,可以非常流畅地运行视频格式转换工作。

· X265 HD Benchmark视频编码基准测试

X265 HD的视频编码测试中,完成的时间在15s,帧率在75 fps,毫无疑问的是,在视频处理方面,锐龙9 7945HX处理器毫无压力。

·V-Ray Benchmark

V-Ray是一款知名的渲染引擎,基于V-Ray内核开发的有V-Ray for 3DMax、Maya等,相信大家都能耳熟能详。而V-Ray benchmark是一个独立的测试软件,其测试的结果可以评估PC的性能,为创作、渲染能力提供参考。V-Ray CPU的测试结果是,相比13代酷睿i7-HX的,提升幅度十分明显,而且你可以理解为不是一个量级。

·PugetBench for PhotoShop

对于AMD锐龙9 7945HX处理器来说,不仅仅可以为玩家带来超爽的游戏性能,内容创作方面同样表现非凡。PugetBench for PhotoShop就是通过对图形的处理来衡量PC的性能,结果可见,1027的成绩处于顶端。

·PugetBench for Premiere Pro

Premiere简称“Pr”,是很多视频博主们常用的剪辑、渲染工具,使用PugetBench for Premiere Pro也能检测PC在视频剪辑方面的性能。最终的成绩达到1034分,意味着搭载了AMD锐龙9 7945HX处理器的ROG魔霸7 Plus超能版可以很流畅剪辑或渲染视频。

显卡

除了性能出色的处理器,我们评测的这款ROG魔霸7 Plus超能版还搭载了GeForce RTX 4090笔记本电脑GPU,采用NVIDIA Ada Lovelace架构,配备16GB GDDR6显存,借助 AI 驱动的DLSS 3,以及光线追踪技术的加持,可为玩家带来栩栩如生的游戏虚拟世界。RTX 4090笔记本电脑GPU的默认频率为1590MHz,默认Boost频率为2040MHz,CUDA Core 核心数量9728,默认功耗在80-150 W之间。

值得一提的是,锐龙9 7945HX处理器集成的AMD Radeon 610M显卡,采用RDNA 2架构,在性能功耗比方面相比上一代有着很大提升,此外还加入了硬件实时光线追踪,在笔记本双显三模的集显模式下,不仅可以发挥移动办公的性能,还能有效延长笔记本的续航时间,实现灵活的应用场景。

来看看RTX 4090笔记本电脑GPU在ROG魔霸7 Plus超能版上的功耗表现。增强模式、独显模式下,使用FurMark 进行烤机,运行16分钟,可以看到GPU功耗可以轻松达到175W满功耗,相比官方的150W额外提升了25W+,温度75.7°C,控制的也相当不错。

3DMark 显卡跑分

DX12下的Time Spy跑分测试中,显卡分数,综合得分。预估的游戏战地V,在1440p分辨率下可以达到180+ FPS。

Time Spy Extreme测试的显卡分数,综合得分为。

Fire Strike是在DX11环境中以1080p分辨率测试图形卡的性能,结果可见,显卡得分达到,综合得分,表现相当不错。

Fire Strike Extreme和Fire Strike Ultra的显卡测试得分分别为、。

光线追踪测试中,Port Royal的测试得分为。

游戏

1.《古墓丽影:暗影》

2.5K分辨率,关闭DLSS,时间抗锯齿、垂直同步关闭,最终获得197 平均帧率。

2.《永劫无间》

2.5K分辨率,关闭DLSS,实战场景下走动时的帧率约160+FPS ,战斗时的帧率约126+FPS,独显模式下的GPU功耗在170W+,基本上满血释放。

3. 《极限竞速:地平线5》

极限竞速:地平线5的基准测试中,2.5K分辨率,画面设置为极高,垂直同步开启,阴影质量极端。最终获得帧率为141。

4.《赛博朋克2077》

NUMA架构

2.5K分辨率,光线追踪超级,DLSS自动,基准测试成绩平均89.79 FPS。

5.《地铁:离去》

1080p分辨率,DLSS关闭,最大帧率214.73,平均帧率120.21。

2.5K分辨率下,最大帧率162.21,平均帧率95.83。

射击类游戏,《CS:GO》游戏设置分辨率2.5K,阴影效果为高,垂直同步关闭,在实战中的帧率350-392+ FPS,非常流畅。

7. 《绝地求生大逃杀》

一款经典的吃鸡游戏,在高画质下,依然可以保持250+的FPS,无论是奔跑还是切换装备,都是丝滑般流畅。

内存

ROG魔霸7 Plus超能版配备了16GB DDR5 4800MHz双通道内存,而且可以后期自行升级。使用AIDA64的内存测试,读取速度为 MB/s,写入速度为 MB/s,Copy速度 MB/s,延迟为85.5ns,整体性能处于高端。

硬盘

ROG魔霸7 PLUS超能版搭配了一个三星1TB SSD,支持NVMe PCIe 4.0。需要说明的是,机身内部还预留了一个M.2接口的SSD硬盘位,方便以后需要的时候扩展。

性能上,使用CrystalDiskMark检测,顺序读取的速度为6612.70 MB/s,写入速度4900.07 MB/s,处于较高水平,日常大文件的copy不用再多等待。

PCMark 10 综合性能评测

PCMark 10可以用于针对现代办公的全面基准测试,包括浏览网站、视频会议、编写电子表格、编辑照片和视频、游戏等日常任务,并给出每个项目的评分以及综合评分,以此对比来衡量PC的性能。结果可见,ROG魔霸7 PLUS超能版在PCMark 10上的综合评分达到分,具体项目而言,在数位内容创作和游戏方面的得分更高,毫无疑问,AMD锐龙9 7945HX处理器和RTX 4090的硬核配置功不可没。

五、评测总结:

通过以上各项理论和游戏等的测试,毫不避讳的说,AMD锐龙9 7945HX处理器的性能可能比你想象中的还要强大,他的出身就是旗舰,而且是媲美同规格台式机的存在。在面对酷睿i9-HX这样的顶 级处理器型号的对手时,无论是在理论性能还是在游戏性能、内容创作等方面,除了单核性能稍逊外,其余多数成绩也都可以明显领先。可见在Zen 4 架构和5nm制程的加持下,锐龙9 7945HX的全大核设计,以及支持的AMD PBO自动超频技术,在多核性能、功耗比方面,与酷睿i9-HX处理器的混合架构相比有明显优势。

回到产品,ROG魔霸7 PLUS超能版还配备了RTX 4090笔记本电脑GPU,如此强悍的组合,足以令专业电竞玩家垂涎和期望。此外还有16GB DDR5内存,1TB PIe 4.0 SSD,240Hz高刷新率,100%DCI-P3色域覆盖,以及RGB背光键盘、U型底盘灯的加持,这样的产品谁不爱呢?

搭载AMD锐龙9 7945HX + GeForce RTX 4090笔记本电脑GPU的ROG魔霸7 PLUS超能版已经开售,目前在京东商城的售价为元,如果你对3A游戏或内容创作有更高性能的需求,或者作为AMD、ROG信仰的终极玩家,那么这款ROG魔霸7 PLUS超能版还是非常值得入手的。

哪些cpu是numa架构

NUMA服务器的基本特征是具有多个CPU模块,每个CPU模块由多个CPU(如4个)组成,并且具有独立的本地内存、I/O槽口等。 由于其节点之间可以通过互联模块(如称为Crossbar Switch)进行连接和信息交互,因此每个CPU可以访问整个系统的内存(这是NUMA系统与MPP系统的重要差别)。 显然,访问本地内存的速度将远远高于访问远地内存(系统内其它节点的内存)的速度,这也是非一致存储访问NUMA的由来。 由于这个特点,为了更好地发挥系统性能,开发应用程序时需要尽量减少不同CPU模块之间的信息交互。 利用NUMA技术,可以较好地解决原来SMP系统的扩展问题,在一个物理服务器内可以支持上百个CPU。 比较典型的NUMA服务器的例子包括HP的Superdome、SUN15K、IBMp690等。 但NUMA技术同样有一定缺陷,由于访问远地内存的延时远远超过本地内存,因此当CPU数量增加时,系统性能无法线性增加。 如HP公司发布Superdome服务器时,曾公布了它与HP其它UNIX服务器的相对性能值,结果发现,64路CPU的Superdome (NUMA结构)的相对性能值是20,而8路N4000(共享的SMP结构)的相对性能值是6.3。 从这个结果可以看到,8倍数量的CPU换来的只是3倍性能的提升。

免责声明:本文转载或采集自网络,版权归原作者所有。本网站刊发此文旨在传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及版权、内容等问题,请联系本网,我们将在第一时间删除。同时,本网站不对所刊发内容的准确性、真实性、完整性、及时性、原创性等进行保证,请读者仅作参考,并请自行核实相关内容。对于因使用或依赖本文内容所产生的任何直接或间接损失,本网站不承担任何责任。

标签: 架构

“释放CPU与内存性能桎梏的终极解决方案-NUMA架构 (释放cpu性能)” 的相关文章

从零开始打造新系统架构的完整指南 (从零开始打造不朽仙域免费)

从零开始打造新系统架构的完整指南 (从零开始打造不朽仙域免费)

架构设计是一个多维度的过程,包括工程架构、业务架构和部署架构等。一个好的系统架构标准应该具备可扩展性、可维护性、可靠性、安全性、高性能等特点。本文主要围绕工程架构设计展开探讨。 二、价值为先...

实时的跨微服务数据访问-可信-微服务架构中的数据一致性-保障可靠 (跨服聊天微信例子)

实时的跨微服务数据访问-可信-微服务架构中的数据一致性-保障可靠 (跨服聊天微信例子)

引言 在微服务架构中,多个服务共同协作以执行原子操作。数据一致性是跨越多个服务执行分布式事务时面临的一项挑战。如果涉及分布式事务流程的某个参与者出现故障,可能会导致数据不一致,例如未下订单却向客...

你自称懂架构-架构设计的真谛!-来这里看看 (架构怎么理解)

你自称懂架构-架构设计的真谛!-来这里看看 (架构怎么理解)

1. 引言 抢红包已经成为春节期间不可或缺的娱乐活动,自2015年微信推出红包功能以来,每年参与抢红包的用户数和红包发放量都呈爆发式增长。微信红包系统的背后蕴含着怎样的技术架构和设计理念,一...

微服务架构监控的原则 (微服务架构监控)

微服务架构监控的原则 (微服务架构监控)

微服务环境中的监控系统:变革与指导原则 引言 微服务架构的兴起彻底改变了软件开发,带来了速度和灵活性。随之而来,监控系统作为微服务控制系统的核心组成部分,也面临着全面的改造需求,以适应微服务环境...

哈啰云原生架构落地实践探索 (哈罗云起)

哈啰云原生架构落地实践探索 (哈罗云起)

全网容器化后一线研发会面临一系列使用问题,包括时机、容量、效率和成本问题,弹性伸缩是云原生容器化后的必然技术选择。 当时第一时间考虑用原生HPA组件,但在实际调研和小规模使用的时候发现了很多...

CSaaS架构-开启数字孪生软件架构的新纪元 (csaas架构)

CSaaS架构-开启数字孪生软件架构的新纪元 (csaas架构)

简介 Browser/Server (BS) 和 Client/Server (CS) 是两种不同的软件架构模式,具有不同的特点和优缺点。本文将对这两种架构进行比较,并介绍山海鲸可视化的 C...

Serverless单体架构的兴起-无服务器计算时代的未来 (server error翻译)

Serverless单体架构的兴起-无服务器计算时代的未来 (server error翻译)

单体与微服务:演变与平衡 应用架构的演变 过去数十年来,应用架构的发展日新月异。早期的开发者曾使用单体应用,但在分布式架构(微服务)的冲击下,单体应用逐渐式微。 微服务的兴起 微服务具有以...

掌控复杂性-创造灵活可扩展的系统-六边形架构 (复杂事物掌控力)

掌控复杂性-创造灵活可扩展的系统-六边形架构 (复杂事物掌控力)

六边形架构是一种架构模式,将外部系统与核心应用程序分隔开来。它的思想很简单:从一个六边形开始,然后应用端口和适配器。 六边形架构的六个边 六边形有六个边,但六边形的形状本身并没有特别含...