Xilinx 推出了史上最强的加速卡——Alveo U55C,专为HPC和大数据工作负载打造。
突破性的高性能计算集群解决方案和简化的可编程性支持在现有客户基础架构和网络上大规模扩展尖端计算的性能。
2021年11月16日
SC21,ST,2021年11月16日,中国北京自适应计算领域的领先公司Xilinx,Inc .(NASDAQ : XLNX)今天在SC21全球超级计算大会上宣布,推出了Alveo U55C数据中心加速卡和基于标准、 API驱动的集群解决方案,用于大规模部署FPGA。alveu55c加速器可以为高性能计算(HPC)和数据库工作负载提供出色的单位功耗性能,并且可以通过Xilinx HPC集群解决方案轻松扩展。
全新的Alveo U55C卡专为高性能计算和大数据工作负载而打造。它是Xilinx历史上最强、最大的Alveo加速器卡,可以提供Alveo加速器产品家族中最高的计算密度和HBM容量。结合Xilinx基于RoCE v2的全新集群解决方案,可以极大地惠及各类运行大规模计算工作负载的客户,支持他们利用现有数据中心基础设施和网络,实现基于FPGA的强大HPC集群。
Xilinx执行副总裁兼数据中心事业部总经理Salil Raje表示,“现在,针对目标HPC工作负载扩展Alveo的计算能力比以往任何时候都简单,、更高效,、更强大。在架构层面,以Alveo卡为代表的FPGA加速器可以以最低的成本为众多计算密集型工作负载提供最高的性能。我们引入了基于标准的方法,支持使用客户现有的基础设施和网络创建阿尔维欧高性能计算集群。通过这种方法,我们将这些主要优势大规模应用于任何数据中心。这是为了实现Alveo和自适应计算,并将这些主要优势大规模应用于任何数据中心。这是Alveo和自适应计算在数据中心更广泛应用的重大飞跃。"
Xilinx Alveo™ U55C 数据中心加速器卡
专为高性能计算和大数据应用而设计
alveu55c卡结合了当前高性能计算工作负载所需的许多关键功能。它可以提供更高的数据流水线并行度、、出色的内存管理、、优化的全流水线数据迁移,以及Alveo产品系列中最高的单位功耗性能。
alveu55c卡采用单槽、全高半长(FHHL)外形,最大功耗低至150瓦。与上一代双插槽Alveo U280卡相比,Alveo U55C提供了出色的计算密度,将HBM2的容量翻倍至16GB。U55C以更小的整体尺寸提供更高的计算能力,有助于创建基于Alveo加速器的密集集群。专门针对高I/O数学、需要性能扩展的大规模计算问题,如大数据分析、AI应用等高密度流数据、开发。
通过使用RoCE v2和数据中心桥接技术,结合200 Gbps带宽,这种由API驱动的集群解决方案使Alveo网络在性能和时延方面与InfiniBand网络相当,而无需锁定制造商。MPI(信息传输接口)集成功能使高性能计算开发人员能够利用Xilinx Vitis统一软件平台扩展Alveo数据管道。借助现有的开放标准和框架,现在可以跨数百个Alveo卡扩展性能,而无需考虑服务器平台和网络基础架构,同时共享工作负载和存储。
借助面向应用和集群的高级编程,软件开发人员和数据科学家可以使用Vitis平台解锁Alveo和自适应计算的优势。Xilinx致力于Vitis开发平台和工具流程,旨在让没有硬件专业知识的软件开发人员和数据科学家更容易使用自适应计算。Vitis平台支持Pytorch、Tensorflow等主流AI框架,还支持C10 1775c、Python等高级编程语言,使开发人员可以通过使用特定的API和库来构建领域解决方案,或者使用Xilinx软件开发工具包,从而轻松加速现有数据中心的关键HPC工作负载。
CSIRO是澳大利亚的国家级研究机构,拥有世界上最大的射电天文望远镜天线阵。CSIRO现在正在使用Alveo U55C卡对其平方公里阵列射电望远镜进行信号处理。部署Alveo卡作为配备HBM的网络附加加速器,可以在整个HPC信号处理集群中实现大规模吞吐量。基于Alveo加速器的集群使CSIRO能够处理海量计算任务,实时聚合来自131,000个天线的、,并过滤、以准备和处理数据。40个Alveo U55C卡通过支持P4语言的100Gbs交换机完全联网,在整个信号处理集群中提供460GBs HBM2带宽。alveu55c集群的处理性能可以达到15Tb/s的总吞吐量,功耗更低,性价比更高,显著节约了成本。CSIRO现在正在完成一个Alveo参考设计,以帮助其他射电天文学或邻近行业取得同样的成功。
Ansys LS-DYNA 碰撞仿真软件几乎用于全球所有的汽车公司。安全性和结构系统的设计往往取决于模型性能,因其能以计算机辅助设计有限元方法( FEM )仿真来降低物理碰撞测试的成本。FEM 求解器是驱动具备数亿个自由度仿真的主要算法,而这些庞大的算法可以细分为更基本的求解器,如 PCG、稀疏矩阵、ICCG。与 x86 CPU 相比,利用超并行数据流水线在大量 Alveo 卡上进行性能扩展,LS-DYNA 能够实现超过 5 倍的性能加速。这能在一个 Alveo 流水线中提高单位时钟周期的工作效率,令 LS-DYNA 客户受益于突破性的仿真时间。
Ansys 战略合作伙伴总监 Wim Slagter 表示:“秉持不懈创新的精神,我们很高兴与赛灵思展开合作,在我们的 LS-DYNA 仿真应用中大幅加速有限元求解器,表征隐式有限元方法 90% 的负载特性。我们期待在赛灵思加速的助力下,实现支持创新者设计未来的使命。”
TigerGraph 是一家领先的图分析平台提供商,正使用多张 Alveo U55C 卡为两种最高效算法进行集群与加速,以驱动基于图的推荐和集群引擎。对于数据科学家而言,图数据库可谓一种颠覆性平台。图从信息孤岛中采集数据并重点关注数据间的关系。图领域的下一个前沿是实时查找答案。Alveo U55C 将推荐引擎的查询和预测时间从数分钟缩短至数毫秒。与基于 CPU 的集群相比,使用多张 U55C 卡扩展分析所提供的出色计算能力和存储器带宽,可将图查询速度提升高达 45 倍。质量评分也提升高达 35%,从而显著提升置信度,将误报几率降至低个位数。
产品供货与轻松评估
Alveo U55C 卡目前可通过 China.xilinx.com 和赛灵思授权分销商购买。该产品还可通过基于公有云的 FaaS( FPGA-as-a-Service,FPGA 即服务 )供应商进行简便评估,也可以通过选定的托管数据中心进行专属预览。集群解决方案现已提供专属预览,预计将于明年第二季度全面问世。