首页>行业资讯> 正文 
投稿
AMD创新第二代 Versal Premium系列自适应SoC平台
  2024-12-20   

近日,AMD(超威)推出第二代 AMD Versal Premium 系列,这是一款面向各种工作负载提供高水平系统加速的自适应 SoC 平台。“第二代 Versal Premium 系列扩展了第一代Versal Premium系列的极限硬IP集成,成为 FPGA 行业首款在硬 IP 中采用 Compute Express Link (CXL)3.1 与 PCIe Gen6 并支持 LPDDR5 存储器的器件。”AMD自适应和嵌入式计算事业部(AECG) 高级产品线经理Mike Rather表示:“产品适用于大数据量以及高计算密度的应用场景,包括数据中心、通信、测试与测量的场景。”

“随着AI的快速发展和重度使用,越来越多的数据、越来越高的带宽,更高效率以及不断演进的安全威胁,这些原来就存在的趋势变得越来越重要。”Mike Rather介绍:“第二代AMD Versal Premium系列主要加强三方面创新:第一是加速主机连接;第二是能释放更多内存;第三是加强数据安全。”以适应不断变化的市场需求,

具体来说—

 

加速主机连接

“第二代 Versal Premium 器件支持主机接口 CXL 3.1 和 PCIe Gen6,其速率都是64Gb/s,可实现快速的高带宽主机 CPU 到加速器连接。与支持 PCIe Gen4 或 Gen5 的 FPGA 相比,PCIe Gen6 能提供了2 ~ 4倍的线速率,而运行 PCIe Gen6 的 CXL 3.1 在类似时延下则能提供使用 CXL 2.1 器件的双倍带宽,以及增强的架构和一致性功能。”Mike Rather介绍。 

CXL 是处理器与器件(例如,基于 FPGA 的加速器)之间的开放式行业标准互连技术。通过将第二代 Versal Premium 系列搭配 AMD EPYCCPU,系统架构师能够利用经 CXL 或 PCIe 连接到高性能 CPU 的最新 AMD FPGA 的器件,以加速数据密集型应用并满足快速的数据增长需求。CXL 还能提供内存一致性的额外益处,有助于实现真正的异构加速计算。

“DDR5的广泛采用成为主流趋势,正在成为市场DRAM类型的主流,连接CXL的内存预计从2024年到2029年的年复合增长率将达到212% 。现出货的半数服务器已经支持CXL。预计到2029年将有99%的服务器支持CXL”。Mike Rather引用DRAM市场监测数据。

 

提高存储器带宽及利用率

“释放更多内存非常重要,因为现在人工智能应用使得数据数量越来越多。”Mike Rather表示。除了加速主机连接,第二代 AMD Versal Premium 系列自适应 SoC 能以至高 8533 Mb/s 的最快速 LPDDR5 存储器连接提高存储器带宽,“在DDR5和LPDDR5上支持的数据速率是第一代产品支持的DDR4和LPDDR4的27倍,并且DDR5和LPDDR5相比DDR4和LPDDR4,消耗功率下降20%~30%。”Mike Rather介绍。

与 CXL 存储器扩展模块进行连接可使总带宽较之单独使用 LPDDR5X 存储器高出至多 27倍。第二代 Versal Premium 系列允许为多个加速器实现可扩展的内存池和扩展,进而优化存储器利用率并增加带宽和容量。

“第二代 Versal Premium 系列自适应 SoC所具有的CXL 3.1存储器扩展模块支持,可增加内存。它支持CXL 3.1接口,可以和很多的DRAM供应商实现兼容。比如,使用LPDDR5X内存可以实现至高256比特。使用两个8道CXL的连接,速率可以达到64 Gb/s。通过这样的架构,从外部存储器的带宽可以超过500Gb/s。”Mike Rather介绍。

通过为多个器件动态分配内存池,第二代 Versal Premium 系列自适应 SoC 旨在提高多头单逻辑器件( MH-SLD )的存储器利用率,使其无需架构或交换机即可运行,同时支持至多两个 CXL 主机。

 

加强数据安全

“在不断变化的安全形势下,增强数据安全性正变得日益重要。AMD在PCIe连接方面增加了完整性和数据加密(IDE);增加了硬内联ECC和加密用于DDR存储器;另有400G高速加密引擎确保网络安全性,”Mike Rather介绍:“这个在第一代Versal产品里就引入了。”

增强的安全功能有助于第二代 Versal Premium 系列在传输和静态状态下均可快速、安全地传输数据。做为业界首款在硬 IP 中提供集成 PCIe®完整性和数据加密支持的 FPGA 器件,新产品的硬核 DDR 内存控制器内置的内联加密可助力保护静态数据,而 400G 高速加密引擎则能帮助器件以至高 2 倍的线速率保护用户数据,从而实现更快速的安全数据事务。“有了PCIe IDE加上高速加密引擎、DDR内联加密与ECC,数据无论是在传输中、静态中、还是使用中都非常的安全。”Mike Rather补充道。

 

除了三大创新,第二代AMD Versal Premium系列还有多个细节创新:“在DSP计算方面,实现了更高的每平方毫米的DSP算力;其还引入了新的收发器GTM2,支持从1.25 Gb/s到128 Gb/s的数据速率,同时还支持NRZ和PAM4编码,为开发者保留了熟悉的设计流程,在使用GTM2时,确保全过程可靠性;在I/O方面,增加了对于高速MIPI C-PHY和D-PHY接口的支持;第二代新加入的LDPC解码器的模块适用于高通量的解码。”Mike Rather补充道。

概括来说,“第二代Versal Premium自适应SoC和AMD EPYC CPU之间能形成非常好的协同。PCIe Express能提供Versal Premium和CPU之间高性能连接,可用于卸载计算、网络以及存储工作负载;也能拥有连贯的接口,这样Versal Premium和EPYC处理器就能够共享内存空间,减少搁置内存。再加上PCIe IDE以及内存DRAM的加密,数据能够做到端到端的安全性。”

Mike Rather还介绍了新器件的一些应用,比如,“在部署GPU集群应用上,之前Virtex UltraScale+ 和第一代Versal Premium都有支持,而第二代 Versal Premium能够在单个网络适配器上支持2个400G接口,提供更高的带宽和灵活性,更好的满足这方面应用需求。再比如,在测试与测量领域,开发PCIe Gen 7器件,包括相关分析器、控制器和练习器,它要求128 Gb/s收发器。这些应用非常重视芯片上的DSP引擎以及内存带宽和其他的接口能力,测试设备支持的协议可能就是C-PHY和D-PHY,第二代Versal Premium系列全部能满足其需求。”

除了器件不断创新,在开发工具方面,AMD不断完善其开发环境,Mike Rather介绍:“Vivado是所有Versal器件统一的设计环境。我们不断地改善Vivado开发环境,以适用于所有Versal,包括第二代Versal Premium系列。通过采用新的P&R算法,改善多线程性能,增强增量流,减少编译时间,引入用于顶层设计的RTL流程,以及用于GTM2的RTL流程,改善质量结果,即QoR与易用性,通过工具引导的时序收敛,改进DFX流程,以及分段配置以加快CPU启动时间和PCIe的唤醒。”

第二代Versal Premium自适应SoC包括多种规格产品,如下表所示。

图片2.png

Mike Rather介绍:“公司将在2024年的第四季度提供功率估算工具;2025年下半年提供全套AMD Vivado工具;2026年上半年将提供芯片的样片以及开发套件,2026年中实现芯片量产。


最新文章
 2024-11-13
 2024-12-27
 2024-12-16
 2024-11-13