“是说芯语”已陪伴您720天
对英特尔来说,“CPU巨头”的标签已经深入人心。不过,在最近两个月,CPU在英特尔的关注度被软件和独立GPU抢了风头。不知从何时起,“软件为先”和“XPU”已经成为英特尔新的流行词。同样,英伟达对ARM的收购,以及AMD对赛灵思的收购,也昭示着芯片巨头们与英特尔的“不谋而合”,它们纷纷将未来的布局瞄准了同一个方向:异构计算。

“通用”与“专用”相向而行

从20世纪60年代的字符终端时代到如今的智能计算时代,数据的量和质都发生了显著的变化。以文本、图表为主的结构化数据比例不断下降,融媒体数据、实时处理的传感级数据等非结构数据,以及深度学习的元数据的持续激增,将越来越多种类、精度的数据以更快的速度进行传输和处理,并成为智能计算的刚需。
作为通用处理器的代表型厂商,英特尔已经将异构计算作为应对AI时代算力挑战的关键战略。如果将数据看作食材,CPU就相当于“瑞士军刀”,适用于一切食材,却不一定能将所有食材处理得又快又好。GPU、FPGA、DSP等专用处理器的加入,让计算架构能更有效地应对场景化数据。
“异构计算的产业的基础是数据的爆炸式增长,这其实是我们发展异构计算的主要驱动力。”英特尔架构、图形和软件集团副总裁兼中国区总经理谢晓清在接受《中国电子报》采访时指出,“CPU提供的是通用型计算的能力,解决的问题很广义。但是GPU、FPGA,或者AI加速芯片解决的是特定领域的问题。现在很多数据的产生都有一定的特点,以至于在CPU上的运算效果不一定是最理想的,在GPU或者其他并行计算能力高的芯片上会跑得更好,这是异构计算的主要驱动力。”
作为专用处理器厂商,赛灵思从器件向异构平台的转变也已开始。赛灵思大中华区核心市场业务发展总监酆毅向《中国电子报》记者指出,智能驾驶正在从ADAS逐渐向全面自动驾驶持续演进,传感器数量的增多势必会带来爆炸式的数据增长,这就需要汽车具备强大的异构计算平台。在工业视觉领域,机器人技术、工业PC、I/O的模块、智能传感器、人机界面等都在产生不同类型的数据。在专业音视频和广播领域,从内容采集到内容消费的全部过程也需要远程管理不同的服务器和计算平台。
“单独的计算架构,无法满足越来越多样的开发需求,因此,异构计算是未来的发展之路。”酆毅指出,“伴随工艺的进步,FPGA也打破了传统的应用边界,进入到AI、数据中心、视频处理、自动驾驶、5G等新兴领域中。而FPGA也通过集成标量处理引擎、自适应硬件引擎和智能引擎,完成了从器件到异构平台的转变。”

引发芯片巨头割据战

在很长一段时间里,处理器市场维持着英特尔、英伟达各自引领CPU和GPU的状态,且AMD在两个市场均为第二。如今,这种局面正在被打破。通过一连串基于收购和自研的“补课”行为,三大处理器头部厂商都在向CPU+GPU+FPGA/NPU的方向靠拢,为异构计算储备“弹药”。
上个月,英特尔时隔22年重返独显市场,正式发布独立显卡iRIS Xe Max。众所周知,英特尔从2015年起,陆续收购了当时第二大FPGA厂商Altera、自动驾驶视觉处理公司Mobileye和云端AI推理芯片Habana Labs等一系列芯片厂商,充实了FPGA和AI专用芯片的产品线。独立显卡的发布,不仅让英特尔弥补了PC产品线的关键零部件,也补齐了XPU异构计算架构的关键拼图。
AMD对赛灵思的收购,也释放出强化异构计算布局的信号。在具备“CPU+GPU”计算架构的基础上,FPGA的可编程特质,能进一步提升计算平台的灵活性,从而适应AI时代根据不同工作负载进行加速的需求。同时,赛灵思在异构计算上也有所积累,已推出Versal ACAP异构计算平台,以缩短车载多传感器同步和融合所带来的系统整体响应时间。据酆毅介绍,赛灵思围绕异构计算的布局已在两年前开始,包括智能驾驶、专业音视频、工业等相关领域,都紧密围绕着异构计算的数据需求进行开发。
对于英伟达,收购ARM不仅弥补了缺乏CPU的短板,也将英伟达的AI计算平台拓展到移动生态。值得注意的是,ARM也在异构计算有所着墨。基于开源的开发框架ARM NN,开发者可以调动ARM CPU、GPU及NPU,实现异构AI开发。据悉,在去年举办的ISC 2019国际超算大会上,英伟达宣布,计划利用其GPU与使用ARM架构的CPU协作打造超级计算机。在宣布对ARM的收购计划后,英伟达再次强调将建造搭载ARM CPU的AI超级计算机。“超算”有望成为英伟达与ARM合流异构计算的第一个“练兵场”。

如何应对“跨生态”挑战

“软件优先。”谈及异构计算的布局思路,谢晓清向记者表示,“在设计硬件、芯片的时候,甚至在设计指令集的时候,我们会以软件优先的原则去做。”
异构计算带来的硬件复杂性,对编程人员提出了严苛的挑战。如果异构计算包含CPU、GPU、FPGA、ASIC四种硬件,就意味着编程人员必须掌握四种硬件的优化代码,才能编写或迁移程序。屏蔽硬件复杂性的软件平台已经成为异构计算的必备工具。
oneAPI是英特尔为异构计算架构打造的开源软件平台,使开发者可以选择熟悉的语言、单一的代码库以及统一的编程模型,来开发跨架构的应用程序。
“我们希望生成一个软件生态,使应用程序开发商基于统一、开放的规范进行开发工作,不会因为软件从CPU迁移到GPU或者是FPGA而进行任何的修改或重复投资。” 谢晓清说。
英特尔不是唯一意识到异构计算需要“软硬兼施”的厂商。在软件平台方面,英伟达推出了CUDA,AMD推出了ROCm,华为也陆续推出了Atlas、CANN等面向异构场景的平台及架构。
异构计算的复杂性和融合性,意味着各大厂商一开始就从生态竞争的维度进行布局。那么,多种生态竞争并存的关系,是否会让开发者在免除跨架构开发的麻烦后,又陷入“跨生态”开发的困难?
对此,谢晓清认为,如果各家将中间平台统一起来,形成相对统一的框架,可以在保持差异性的同时降低上层应用的开发难度。
“如果各个芯片厂商都从最底层做软件,重复投资会非常大。在理想情况下,应当有一个框架,在这个框架下每家做好自己的硬件优化。对上层应用开发者来说,硬件复杂性被屏蔽掉,且编译器、库函数、接口等均已定义好,在这个统一的框架下再开发编程即可。在运行应用的时候,负载会自动流向最合适的硬件,这可能是未来异构计算的理想情况。”谢晓清说。

发表评论

邮箱地址不会被公开。 必填项已用*标注