感谢IT家庭用户在华南吴彦祖的线索传递!
今天,英特尔正式推出了全球首款搭载HBM内存的x86 CPU英特尔至强Max系列,也就是我们之前所说的蓝宝石Rapids旗舰产品线。
新至强处理器中的56个内核都是P内核,可以提供112个线程和350W TDP它采用基于EMIB的设计,分为四个集群但最有意思的是,它还拥有64 GB的HBM2e内存,分为四簇16 GB,总内存带宽1 TB/s,每个核的HBM超过1 GB
英特尔还表示,HBM内存的集成不需要更改代码,它应该是无缝的,对用户透明的。
为了确保不会遗漏任何HPC工作负载,我们需要一个能够最大限度地提高带宽,计算能力,工作效率和最终影响力的解决方案Max系列的英特尔产品为更广阔的市场带来了高带宽内存,以及一个API,让CPU和GPU之间更容易共享代码,更有效地解决世界上最大的挑战
——英特尔公司副总裁,超级计算集团总经理杰夫·麦克维
根据介绍,这56个核心由四个管芯组成,通过英特尔的多芯片互连桥连接,其中封装了64GB的HBM内存该平台将采用PCIe 5.0和CXL 1.1 I/O接口
同等性能的HCPG,功耗比AMD Milan—X集群低68%。
AMX扩展可以提高AI的性能,并为INT8和INT32累积操作提供比AVX—512高8倍的峰值吞吐量。
提供在不同HBM和DDR内存配置中运行的灵活性。
工作负载基线:
气候建模:仅使用HBM比MPAS—A上的AMD Milan—X快2.4倍
分子动力学:在DeePMD上,与采用DDR5内存的竞争产品相比,性能提升2.8倍。
性能方面与旧的英特尔至强处理器8380系列或AMD EPYC 7773X相比,它可以在某些工作负载下提供5倍的性能
值得注意的是,AMD明天将发布基于热那亚的数据中心CPU,两个系列的CPU都已经交付给OEM,所以比较这些数值是没有用的。
新CPU还包含20个加速引擎,主要用于AVX—512,AMX,DSA和英特尔DL Boost工作负载据说Intel在MLPerf DeepCAM训练中的表现比AMD 7763高3.6倍,比NVIDIA A100高1.2倍
据报道,英特尔至强Max CPU将首次亮相极光超级计算机,目前正在阿贡国家实验室建造本站了解到,Aurora有望成为第一台峰值双精度计算性能超过2 exaflops的超级计算机
此外,Aurora将首次展示在单个系统中配对Max系列GPU和CPU的强大功能,超过10,000个刀片,每个刀片包含6个Max系列GPU和2个Xeon Max CPU。