您好,欢迎来到bob中国

技术交流

bob中国

技术交流

技术交流

首页 > 技术交流

英伟达联手Arm迎战高性能计算!GPU加速卡将支持Arm架构CPU

来源:技术交流    发布时间:2024-07-06 08:36:40

  智东西6月17日消息,在今日于德国举行的ISC 2019国际超算大会上,美国芯片巨头英伟达(NVIDIA)今天宣布其用于超级计算机的加速平台将对Arm架构CPU支持,即计划利用其芯片与使用Arm架构的CPU协作打造超级计算机。

  这为高性能计算(HPC,High Performance Computing)行业开辟了一条全新的路径,为可以在一定程度上完成“exascale”性能的超级计算机铺平道路,有助于构建具有极高能效水平的百万兆级AI超级计算机。

  NVIDIA表示,将于年底前向ArmECO提供全堆栈的AI和HPC软件。堆栈优化完成后,NVIDIA将能为包括x86、POWER和Arm在内的所有主流CPU架构提供加速。

  此外,NVIDIA还于今日推出了全球排名第22快的超级计算机DGX SuperPOD,据称可满足无人驾驶车辆部署计划的大量需求。

  NVIDIA一直是数据中心市场的佼佼者,其GPU芯片被用于与英特尔、IBM等公司的中央处理器(CPU)协同工作,完成大规模并行计算的加速任务。

  在超大规模数据中心和高性能计算的服务器市场,英特尔x86处理器长期占据主导地位,随后IBM Power芯片则成为后起之秀,而IBM的Power处理器在近年亦出现翻盘之势,主要在中低端服务器芯片市场分食x86的市场蛋糕,而Arm则试图在中低端服务器市场赢得更多的市场份额。

  英国Arm公司是全球领先的半导体知识产权(IP)供应商, 于2016年被日本软银集团以234亿英镑(约合310亿美元)高价收购。

  不同于英特尔和IBM,Arm公司本身不直接从事芯片生产,而是依靠给芯片厂商们提供底层的处理器架构授权,从而取得授权费用和一定版税。

  苹果、三星、高通、华为、飞利浦等各大芯片厂商们都从Arm那里购买授权,全球绝大多数智能手机和平板电脑等便携式消费电子科技类产品均采用Arm架构。

  和其他架构相比,Arm的一大特色在于出色的能效,它能够为超级计算机提供开放式架构,因此用户都能够添加各种有益于超级计算的有趣技术,例如紧密集成。

  NVIDIA副总裁兼加速计算总经理Ian Buck称,通过将Arm CPU与Tesla GPU相结合,使用者能够实现大量的HPC仿真和AI所需的繁重计算,并且Arm能够正常的使用快速单线程来执行CPU。

  Arm已经在世界各地的许多HPC中心获得了慢慢的变多的关注,此前采用Arm架构的exascale系统没GPU,如今NVIDIA新增对Arm支持的举动并不令人意外。

  Buck表示,从技术角度来看,用Arm制造超级计算机的项目将是一次“重举”。据他介绍,现在是NVIDIA宣布支持Arm CPU的最佳时期,他们花了两年的时间来完成所有这些工作,希望在今年年底之前发布第一个完整版本。

  NVIDIA支持Arm CPU后,将为研发超算的研究人员们提供了除英特尔和IBM外的第三种选择,并使得研发者能够最终靠这种方式获得更多的自主控制能力。

  HPC市场预计到2025年价值将达到596.5亿美元,NVIDIA一直是推动高性能计算发展的重要力量。今日发布的Green500排行榜,在全球最节能的25款超级计算机中,有22款都得益于NVIDIA的支持。

  之所以能有如此成绩,源自NVIDIA的多项核心技术。采用NVIDIA GPU的超级计算机,能够将繁重的处理作业卸载至更为节能的并行处理CUDA GPU之上,另外NVIDIA与InfiniBand和以太网互连供应商Mellanox合作优化整体超级计算集群的处理,NVIDIA还在SXM 3D封装技术和可实现极密集型扩展节点的NVIDIA NVLink互联技术方面投入大量研发。

  NVIDIA对基于Arm的HPC系统的支持建立在双方超过10年的合作基础之上。NVIDIA的几款用于便携式游戏、无人驾驶汽车、机器人和嵌入式AI计算的系统级芯片产品都采用了Arm。

  据悉,NVIDIA将于年底前向ArmECO提供全堆栈的AI和HPC软件,该堆栈为600多个HPC应用程序和所有AI框架提供加速,这中间还包括所有NVIDIA CUDA-X AI和HPC库、GPU加速的AI框架和软件开发工具,如支持OpenACC的PGI编译器和性能分析器。

  NVIDIA创始人兼首席执行官黄仁勋表示:“超级计算机是促进科学发现的重要工具,建立百万兆级超级计算将能够极大地扩展人类知识的边界。随着传统计算规模扩展步伐的停止,功率也将成为所有超级计算机的限制因素。NVIDIA CUDA加速的计算和Arm的高能效CPU架构的相结合,将助力HPC社区实现大幅度的提高,以达到百万兆级。”

  “Arm正在与ECO合作,为基于Arm的SoC带来前所未有的计算性能提升,并实现百万兆级功能,”Arm首席执行官Simon Segars表示,“HPC社区已经部署了Arm技术,以应对全球最复杂的研究挑战。通过与NVIDIA合作,将CUDA加速引入Arm架构,这一举措对于HPC社区来说,可谓是一大重要里程碑。”

  Ampere Computing董事长兼首席执行官Renee James认为,其客户正致力于寻求基于Arm的高性能处理器,来运行其最苛刻的工作负载,因此很高兴NVIDIA正在将CUDA和围绕NVIDIA所建立的丰富的ECO引入Arm。

  Arm生态系统另一位领导者——Atos的高级执行副总裁、大数据和网络安全部门负责人Pierre Barnabé亦表示,这一重要发布将加速AI和模拟世界的融合,同时优化能效。

  Cray总裁兼首席执行官Peter Ungaro表示,其Cray系统管理和编程环境(编译器、库和工具)已经能够在XC和未来的Shasta超级计算机上支持Arm处理器,将CUDA和CUDA-X HPC和AI软件堆栈用于Arm平台,并将其与Cray系统管理和编程环境紧密集成。

  此外, CSC、 EPI、HPE、Jülich超算中心、Marvell等均表态称,看好将Arm架构与NVIDIA GPU相结合,认为它将有利于优化HPC和AI工作负载,匹配未来百万兆级前(pre-exascale)解决方案的构建模块,助力HPC行业解决日益不可持续的功耗水平问题。

  在高校与科研机构的一些专家也发表了看法,比如理化学研究所计算科学研究中心负责人、东京工业大学教授Satoshi Matsuoka。

  “过去十年中,我们从始至终积极率先在大型超级计算机上采用NVIDIA GPU,包括日本最强大的ABCI超级计算机,”Satoshi Matsuoka说,“理化学研究所计算科学研究中心目前正在致力于开发下一代基于Arm的百万兆级Fugaku超级计算机,我们很高兴听到NVIDIA的GPU加速平台很快将能用来基于Arm的系统。”

  今日,NVIDIA还推出了全球排名第22快的超级计算机:DGX SuperPOD。据NVIDIA人工智能基础设施副总裁Clement Farabet表示,它提供的AI基础设施可满足公司无人驾驶车辆部署计划的大量需求。

  它比同等顶级超级计算系统小约400倍,组装只需三周,同时提供9.4 petaflops的计算性能。在实测中,它试图在不到两分钟的时间内训练基准AI模型ResNet-50。

  “很少有AI挑战与训练无人驾驶汽车一样苛刻,这需要对神经网络进行数万次重新训练,以满足极端的精确度需求,”Farabet说,“没有像SuperPOD那样的大规模解决能力的替代品。”

  客户可以从NVIDIA的任何DGX-2合作伙伴处购买SuperPOD的全部或部分内容。

  如果NVIDIA按照预期,在年底前为ArmECO提供全套的AI和高性能计算(HPC)软件,这将为超算研发者们提供除x86、Power之外,另一种更具开放性的选择。

  此外,从众多业内人士的表态来看,这一重要发布对于基于Arm打造超级计算机的研发机构或企业而言,将是进一步扩展其超算性能,推动高性能计算提供更出色能效的重要推动力。

上一篇:【48812】电脑装机模仿CPU及显卡功能汇总表 3DMark全评分
下一篇:Intel:1314代酷睿补丁简直无损功能!未来悉数的产品都安全