AMD透露了Nvidia DGX A100系统更多细节
发布时间:2020-06-10 07:51:25
AMD和Nvidia在技术上的竞争由来已久,所以这可能会让人感到意外。AMD刚刚公布了Nvidia基于Ampere的DGX A100 AI系统更多规格。Nvidia上个月以A100 GPU的形式披露了其Ampere GPU架构。它基于7nm工艺,专为云计算、人工智能和科学数字计算而设计,拥有540亿个晶体管、6912个CUDA核心,速度是之前Volta解决方案的20倍。
该公司的DGX A100系统采用8个新GPU与AMD的两颗Epyc 7742处理器配对。这些运行速度高达3.4GHz的Zen 2 CPU,让系统共有128个核心和256个线程。因为合作关系,Nvidia允许AMD进一步分享DGX A100系统的细节。
AMD数据中心生态系统和应用工程公司副总裁Raghu Nambiar表示,只有第二代AMD EPYC处理器才能在单个x86数据中心处理器中提供多达64个核心和128条PCIe 4互联通道,我们很高兴看到Nvidia DGX A100系统强大功能如何使I/O带宽有效地翻倍。
DGX A100使用600 GB/s NVSwitch链路连接8个A100 GPU,帮助提供5 petaflops的计算性能,它还配备了320GB的GPU内存,带宽为每秒12.4 TB。DGX A100价格达到$19万9千美元。Nvidia副总裁兼DGX系统总经理Charlie Boyle表示,Nvidia DGX A100在性能和功能方面实现了巨大的飞跃,DGX A100所使用的第2代AMD Epyc处理器提供了高性能和对PCIe Gen4的支持。Nvidia将这些功能用于打造世界上最强大的AI系统,同时保持与整个DGX系列所使用的GPU优化软件栈的兼容性。
至于为什么Nvidia选择了竞争对手的CPU,而不是英特尔的CPU,Nvidia表示,英特尔的Xeon芯片是首批DGX系统的首选处理器,但是,Epyc处理器提供的额外功能和性能使其成为一个简单的选择。为了保证系统中GPU的数据供应,我们需要一个快速的CPU,尽可能多的核心和PCI通道。我们使用的AMD CPU每颗都有64个核心,大量的PCI通道,并支持PCIe Gen4。