最近,amd正式发布了第五代turin epyc 9005系列,在前四代的扎实基础上,工艺架构、规格性能等各方面立体化升级,再次取得“遥遥领先”。
发布会后,快科技采访了amd服务器部门高管ravi kuppuswamy、madhu rangarajan等人,对epyc 9005系列的更深入细节做了一番交流。
首先谈谈epyc 9005系列的工艺问题。
上一代的epyc 9004/8004系列,都是基于5/6nm工艺,也就是ccd计算模块是5nm,iod输入输出模块是6nm。
这一代则升级使用了3/4/6nm三种不同的工艺,其中iod模块还是6nm(但内部进行了升级),ccd模块首次分为两种:zen 5版本采用的是4nm,zen 5c版本采用的是3nm。
为何如此区分?原因其实很简单,更先进的工艺可以让zen 5c ccd模块在有限的芯片面积内塞入更多模块、更多核心。
zen 5部分的ccd每个内部还是8核心,但是ccd数量从上代的12个增至16个,得以从最多96核心192线程增至最多128核心256线程。
zen 5c部分的ccd每个内部依旧是16核心,ccd数量则从8个增至12个,上代的最多128核心256线程,就变成了空前的最多192核心384线程,创下x86处理器新纪录。
amd epyc 9005系列领先架构大揭秘!首次采用三种不同工艺
其次是架构方面。
上一代epyc首次引入了zen 4、zen 4c两种架构版本,并划分出genoa epyc 9004系列、bergamo 97x4系列两条产品线,后者进一步延伸出了siena epyc 8004系列。
新一代epyc在延续这一设计的同时,也对产品体系做了调整。
epyc 9005系列进化为zen 5、zen 5c两种版本,一如上代,它们俩并非传统的所谓“大小核”,而依然是完全相同的架构、ipc性能、isa指令集,一二缓存总量也相同,唯一的区别还是后者的核心更多,所以其每核心的缓存小一些。
事实上,无论zen 5还是zen 5c,整颗芯片的最大缓存总量是相同的,但由于zen 5c的每个ccd内拥有两倍于zen 5的核心数,因此分配到的缓存更少一些,每个核心最多32mb。
这么做的好处是zen 5c可以容纳更多核心,支持更高密度计算,同时与zen 5共享系统平台,对于操作系统和应用软件来说也不需要特殊的适配和优化,大大降低客户成本,加速普及。
需要强调的是,如果跨ccd访问缓存,延迟会变得非常高,大大影响性能,因此amd没有做缓存的跨ccd全共享设计,每一个ccd内的核心只访问自己的缓存。
如果仔细看epyc 9005系列会发现zen 5、zen 5c都在其中,没有刻意划分(甚至产品代号都同为“turin“),不像上代分为不同产品系列。
amd发言人对此表示,上代的genoa、bergamo是分不同时间发布的,但是zen 5、zen 5c是同时发布的,基于统一的产品栈,所以它们就是在一起的。
amd也贴心地提供了详细的产品列表,展示不同的sku型号,可以看到不同的主频、不同的缓存、不同的功耗。
如果一定要区分也简单,8-72核心的都是zen 5,144-192核心的都是zen 5c,96/128核心的编号9x55的为zen 5、编号9x45的为zen 5c。
amd epyc 9005系列领先架构大揭秘!首次采用三种不同工艺
另外,iod虽然工艺没变,但是内部做了升级,主要是提升了内存、内存速度,以及iod/ccd核心之间的沟通,可以理解为在i/o物理层与核心之间的互连性能会更好。
但是,amd并没有在iod内集成专门的ai加速器,因为amd发言人表示,这样会增加芯片面积和功耗,也会吃掉内存带宽,如果需要ai加速,用更专业的gpu就好了,比如amd自家的instinct mi系列,它们的性能会更好。
amd发言人说到,gpu拥有每美元的最佳ai性能,而cpu能实现每美元的最佳通用计算性能。