新闻中心 - 深圳亿时空科技有限公司

缓存容量破纪录！AMD 米兰-X将性能再提升66%

发布时间：2022-03-23 15:35:04

2022年我国政府工作报告中，可以看到较为突出的关键词有：“减碳”“治理”“改造”“推进”及“节能”等等，重点推进碳达峰、碳中和工作，并落实行动方案。

在关于数据中心发展方面，则多次使用了“约束、加强”之词，如：进一步约束数据中心的水资源利用率和循环措施；提升PUE+WUE效率，加强中水使用；加强数据中心废水、废油、烟气排放管理。

并且，随着能源、金属等价格的上涨，数据中心的投资与运维成本将继续上升，企业应进一步通过新技术来降低数据中心的成本。

数据中心节能，AMD已在路上

我们再来看看数据中心，在一排排星罗密布的机架中，能耗最高的当属CPU和GPU，它们一直都被誉为多核心、超高频率的“组合体”，动辄几百瓦的功耗需要大量制冷设备为其辅助散热，因此老旧数据中心的PUE值一直难以降下。

随着技术的不断演进，CPU的效率也越来越高，凭借核心数量及性能的优势AMD提出了“单路打双路”及“一台打多台”的新思路。值得关注的是，在很多企业级应用场景中，AMD确实做到了！

时至今日，AMD EPYC经历了三代的更新，性能方面已经“修炼”得炉火纯青，那么在2022年它将给企业级用户带来什么呢？

没错！就是3D V-Cache。

正如之前互联网上的各种预测那样，AMD这次真的将3D V-Cache引入了EPYC处理器上，并让单颗处理器L3缓存容量破天荒地提升至768MB，或双路平台L3缓存则首度破“GB”大关，达到了1.5GB。

这，就是传说中的米兰-X！

米兰-X问世，破纪录的L3容量

2022年3月21日，AMD正式推出搭载AMD 3D V-Cache技术的第三代AMD EPYC（霄龙）处理器，其内部代号为米兰-X。它可以看作是第三代EPYC的增强版，在保持功耗不变的同时，在诸多企业级应用场景下能够提供更高的性能。

3D V-Cache的首度亮相是在Computex 2021上，是通过3D形式堆叠更多芯片模组，进而构建出更大容量的3D垂直缓存（3D Vertical Cache）。近日AMD公布了第一款采用 AMD 3D V-Cache技术的锐龙处理器——锐龙7 5800X3D 处理器，就是通过3D V-Cache技术在顶部3D封装额外的新缓存，将三级缓存扩容到96MB，凭借这项行业领先的技术，5800X3D 的游戏性能可提升15%。

正如前文所述，在面向企业级的EPYC（霄龙）处理器中，AMD推出了拥有3D V-Cache技术的米兰-X处理器，并提供 16核7373X、24核7473X、32核7573X及64核7773X，共计4款可供选择。

64核128线程的旗舰型号7773X处理器，基础频率为2.2GHz，加速频率可达3.5GHz，TDP功耗280W。与米兰相比，米兰-X总L3缓存容量提升至768MB，相当于前者的3倍。

打破系统瓶颈的768MB缓存

我们来看看3D V-Cache缓存的分布情况。谈到AMD的Zen架构处理器，相信大家对CCD一定不会陌生，其为Core Chiplet Die的缩写，可以看作是多颗核心组成的处理器单元。

图：Zen3架构下的CCD单元（米兰）

一般情况下CCD核心单元包含CCX（CPU Complex，可看作是纯计算单元）及Infinity Fabric，每个CCX整合了8个Zen内核，每个核心都有独立的L1与L2缓存，L3缓存则为共享形式。因此，以Zen3架构EPYC 7003处理器为例，一组CCD核心单元就具备8核16线程，以及可共享的32MB的L3缓存。8套CCD核心单元组成具备64颗核心、128线程合计256MB的L3缓存。

CCD核心与I/O之间采用Infinity Fabric总线连接，它在扩展性、延迟和能效方面都表现出色，具备512-bit总线位宽。相比上一代罗马，EPYC 7003的每颗核心均可访问CCD单元中32MB的L3缓存，这在很多企业级应用中能够明显提升计算性能。

对处理器而言，L3缓存容量的大小极为重要。如果简单地将存储分层的话，可以看到站在性能制高点的是L1和L2缓存，但由于频率极高，受限于晶体管数量及良品率控制，所以容量不能做的很大。而再下一级就是L3缓存和内存，相比之下内存依然是“CPU之外”的存储，其位宽、频率及延迟等性能要远远逊于CPU缓存，所以这里就会出现一个超高速率的处理器+小容量缓存与大容量内存之间形成的性能“断层”。

如何很好地弥补这一“断层”？需要L3缓存来实现。L3缓存依然位于CPU内部，因此性能强劲，且容量能够做得相对大一些，就像是高速度的“存储池”，L3缓存向上承接超高速的L1及L2，向下则与更大容量但速度较慢的内存进行数据交换。因此L3缓存是拓宽系统数据交换瓶颈的重要“交通枢纽”。

多年来，AMD也是潜心致力于扩大L3缓存容量，用以提升整体性能。随着制造工艺的不断进步，3D V-Cache得以实现，AMD 米兰-X此次提升的就是CCD单元中L3缓存容量，从之前的32MB飙升至96MB，组成了共计768MB的超大容量。

另外值得关注的是，AMD推出的这四款米兰-X处理器无论核心数量多少，均配备了768MB的L3缓存，因此可以用脱胎换骨来形容。

米兰-X性能最高提升66%

如此规模庞大的L3缓存可以说是史无前例，那么它到底能带来多大的性能提升呢？

此次AMD也对米兰-X进行了全面测试，其中包括计算流体动力学（CFD）、有限元分析（FEA）、电子设计自动化（EDA）以及结构分析，这四大领域。

EDA是Electronic design automation的缩写，指的是利用计算机辅助设计（CAD）软件，来完成超大规模集成电路芯片的功能设计、综合、验证、物理设计，包括布局、布线、版图、设计规则检查等流程的设计方式。

在当今这个数字化时代，EDA被誉为半导体设计、制造方面的基石，也是工业领域重要的组成部分。包括AMD、高通、三星等厂商在芯片设计方面也都离不开EDA。在各种复杂设计的模拟方面，性能强劲的服务器可以让工作效率实现大幅提升，并可直接缩短设计周期。

在EDA测试中，拥有3D V-Cache的第三代AMD EPYC 7373X对比EPYC 73F3，结果显示能够为Synopsys VCS这样的EDA RTL模拟提供高达66%的性能提升。

此外，在FEA、CFD等分析及仿真程序测试中，米兰-X也表现出了更强大的性能，并且能够帮助企业级用户在同样的时间内解决更多问题。

AMD继续扩大朋友圈，

软硬合作伙伴同发力

近年来，EPYC的成功让AMD朋友圈逐渐丰富了起来，几乎所有的硬件厂商都已经成为了AMD的合作伙伴，也帮助其在企业级市场屡屡攻城略地。

此次米兰-X的发布，AMD又将生态进一步扩充，软件方面支持了包括Altair、Ansys、Cadence、Dassault Systèmes、Siemens以及Synopsys等生态伙伴，让EPYC能够享受更多软件优化，进一步提升工作效率。

拥有3D V-Cache的AMD 米兰-X处理器也给云计算注入了全新的活力。据了解，基于米兰-X的Microsoft Azure HBv3虚拟机将于近期正式上线，相比前代HBv3系列虚拟机，能够在关键HPC 工作负载中的性能提升高达 80%。

服务器方面，此次包括Atos、Cisco、Dell、HPE、Lenovo、QCT以及Supermicro在内的众多OEM合作伙伴都已经为Milan-X做好了准备，近期用户就可以享用3D V-Cache了。

一直以来，AMD EPYC都凭借更多的核心及更高地性能在企业级市场中大放异彩，很多用户都用更少数量EPYC服务器替代了原有平台，在降低功耗与采购成本的同时又减少了能耗，兼顾了节能与高性能。全面迎合了我国数据中心未来发展方向。

在“Zen 4”推出之前，AMD发布米兰-X，不断的强化自己的产品阵营，以更高的性能迎接来自竞争对手的挑战。而在绝对性能方面，米兰-X又再次刷新了多项纪录，给企业级用户交上了一份合格的答卷。