本文来自 微信公众号“半导体行业观察”。
近日,英伟达(NVDA.US)发布了其今年第二季度财报,该公司第二季度营收为38.66亿美元,与上年同期的25.79亿美元相比增长50%,与上一季度的30.80亿美元相比增长26%,超出分析师预期。
按业务类别划分,英伟达游戏业务营收为16.5亿美元,同比相比增长26%,环比增长24%。英伟达数据中心业务第二季度营收(包含Mellanox业绩在内)为17.5亿美元,同比增长167%,环比增长54%。
被觊觎的处理器芯片
英伟达服务器相关芯片的业绩,在他们的财报中体现在数据中心这一业务上。值得注意的是,2016年英伟达的服务器业务收入仅为8.3亿美元,可见该项业务发展的迅速,不仅如此,这也是英伟达的服务器芯片营收首次超越了游戏芯片。
这对于NVIDIA来说意义非凡,此前英伟达一直都是以游戏为主要业务,但该市场总量有限,为此他们一直觊觎英特尔(Intel)垄断的服务器芯片市场。
在过去数年,英特尔在服务器芯片市场一直都占据优势,AMD无力与英特尔竞争一度导致英特尔占有服务器芯片市场的份额高达97%,然而从英伟达发布的数据来看它正实实在在的威胁着英特尔在服务器芯片市场的地位。
从今年二季度的业务数据来看,英伟达数据中心的营收已相当于英特尔的数据中心业务的24.6%,上一季度比重为12.9%。当然就目前来说,英伟达的这些收入还是主要来自于它的GPU,在CPU市场上占有的份额还较为有限。
AMD都无能为力,英伟达却步步紧逼,是怎样的“三十六计”,让它这么牛气?
借AI突围
早在2011年,就有国媒体体报道,英伟达计划使其Tegra芯片进军服务器市场,该芯片内核将集英伟达图形处理器的并行处理能力与ARM的低能耗特性于一体。挑战英特尔在服务器芯片市场上的主导地位,不过之后水花并不大,游戏业务依旧占大头。
相关报道指出,在数据中心业务还未真正开始爆发式增长前,英伟达靠着游戏市场的成功,为公司大力研发通用计算型GPU及AI相关应用提供了坚实的后盾,在英伟达布局服务器市场芯片市场道路上,游戏业务功不可没。
2016年,AI兴起,数据中心市场开始爆发。半导体行业在经历了智能手机及消费电子驱动的周期后,迎来数据中心引领发展的时代,CISCO 预计,2016-2021年全球数据中心负载将成长近三倍。
数据中心负载任务量变化 资料来源:Cisco Global Cloud Index 2016-2021
借着这股东风,英伟达乘势而上,其GPU在AI领域取得关键优势。英伟达的GPU拥有比英特尔的CPU更强的并行计算、低精度运算等性能,由于这种优势当前全球大多使用英伟达的GPU训练神经网络。
根据《中金公司》的研报显示,自2016 年起,英伟达公司数据中心业务收入一路攀升,同比增长率连续七个季度(2QFY17-4QFY18)超100%。
英伟达数据中心业务单季收入及同比增长率 资料来源:英伟达公司官网,中金公司研究部
与公司其余业务线比较来看,数据中心业务增速领先一直持续了两年时间,增速基本为游戏业务的 2-3 倍。
资料来源:英伟达公司官网,中金公司研究部
依靠GPU的这种优势,英伟达开始进军服务器市场。在当前的服务器市场,英特尔的X86处理器占据绝对优势市场份额,获得99%的市场份额。英伟达进军服务器市场选择的是ARM架构,希望借助ARM架构所拥有的低功耗、低成本优势挑战英特尔在服务器芯片市场的垄断地位。
扬长GPU
正如前文所说,英伟达的这些收入还是主要来自于它的GPU,在CPU市场上占有的份额还较为有限。为了扬长补短,NVIDIA似乎正在拼命的把要做的事情往GPU里放。
去年,英伟达发布了GPU Direct Storage,让GPU可以直接连到NVMe存储设备上。这一方案用到了RDMA设备来把数据从闪存存储转移到GPU本地的内存里,无需经过CPU还有系统内存。英伟达提到,将资料从储存器加载到GPU,过去都是由CPU负责,而这将会成为硬件效能的瓶颈。
来源:英伟达
这一举措顺利的话,英伟达就能摆脱对于CPU的依赖开辟一片全新的领地,全新的市场,比如数据科学和机器学习市场,这一市场将造就每年200亿到250亿美金的服务器市场。
2020年4月,英伟达击败英特尔,支付69亿美元成功收购了Mellanox,Mellanox以InfiniBand和以太网产品线知名。这起收购的目的,是将英伟达的加速计算平台与Mellanox全球知名的加速网络平台结合,共同创建新一代数据中心级解决方案。
事实上,这一做法并不新鲜。此前在《摩尔定律的突围》一文中有提到,早在2015年,微软就开始在其云计算服务Azure中布局的Project Catapult,这是通过以太网连接的FPGA在数据中心对服务进行加速的方案。该方案在每台服务器的CPU和NIC(网卡)之间放置一个有自己协议栈的FPGA,FPGA利用服务器之间的以太网进行互联通信,而FPGA的本质是对CPU处理网络通信的功能进行卸载(offload),由FPGA来专门处理服务器之间的通信,这样可以让CPU专注于计算。
为了绕过CPU,实现GPU互连。英伟达提出了NVLink和NVSwitch技术,基于此,英伟达在2017和2018年发布了DGX-1和DGX-2,其中DGX-2实现了16个GPU的两两互连。然而这种方案在数据中心层面的可扩放性(scalability)十分有限。
如果使用以太网连接GPU,就能从根本上解决GPU在数据中心层面的可扩放性问题。然而,与FPGA不同,GPU本身作为一个加速卡的存在,是无法作为一个主机使用的,无法单独支持以太网协议栈,直接处理网卡中的数据。也就是说GPU就无法像微软Project Catapult中的FPGA那样,绕开CPU独立作为网络中的一个节点实现互连。
因此,英伟达使用RDMA技术解决了这个问题,RDMA协议中应用程序可以绕开CPU直接与网卡交换数据,GPU支持与网卡分享内存。这样,RDMA协议就能够使GPU通过网络,直接读取另外的GPU中的数据。
英伟达收购的Mellanox的InfiniBand是最早实现RDMA的网络协议,这次收购帮助Nvidia补齐在云数据中心架构方面的短板,减少了对游戏行业的过度依赖。
虽然竞购Mellanox失败,但是作为服务器芯片巨头的英特尔并不甘示弱,转手就收购了Barefoot。Barefoot是一家以太网交换机芯片研发公司,自定义了自家的芯片架构PISA,并设计了相应的编程语言P4,直接对标交换机芯片龙头Broadcom,同时Barefoot能为英特尔提供数据中心完整的网络功能,驱动数据中心SDN的发展,实现存储、网络和接口的硬件虚拟化,让英特尔得到了精细的软硬件资源管理能力,从而更好地为客户提供大型数据中心服务。
补短CPU
在GPU领域一骑绝尘的英伟达依旧不满足,似乎对CPU也起了心思,北京时间7月23日凌晨,Bloomberg发布消息称Nvidia正在收购Arm,引起了半导体业界的关注。不过,在近日的财报会上,被问及收购Arm一事时,黄仁勋避开了这一敏感话题。
鉴于该并购案对产业影响之广,因此,在没有实锤之前,想必各方都会非常谨慎。但我们依旧可以揣测一下,为什么英伟达对Arm感兴趣?
远的不说,就谈服务器芯片领域。众所周知,目前云端服务器的主流处理器仍然是基于x86架构,另一方面,Arm在云端服务器领域的发展势头也非常好,此前亚马逊和华为都公布了基于Arm的CPU服务器。
对于英伟达来说,目前在云端服务器端的应用主要是基于AI加速的GPU,并且在AI生态上确实全球领先,但是如果想要进一步在云端服务器做突破,则需要在云端走入AI之外的应用,或者在云端AI领域应用到更多的领域。这两者都需要CPU。
目前,云端服务器上还有大量非AI的应用跑在CPU上,除此之外,即使是AI应用,也有大量算法难以用GPU加速,因此也是跑在CPU上。如果英伟达想要加强其在云端服务器领域的市场占有率,或者想要在云端AI领域巩固其主导地位,那么收购一个CPU公司并且和其GPU生态整合到一起将是不错的选择。
一旦Arm被成功收购,英伟达在CPU上的短板也将被补齐,英伟达将具备完整的CPU+GPU能力,能够构筑一个横跨移动、PC、服务器端的生态帝国,这将给英特尔带来前所未有的压力。
总结
英伟达在数据中心业务上的强劲增长,是其在市值上超越英特尔的关键筹码。当然,客观来说,目前其在服务器芯片市场相比起英特尔还太弱,Arm方面也不过是寄望之后可以赢得有限的市场份额。
另一方面,英特尔也在改变,正在努力实现多元化。此前收购了一系列公司欲改变其在人工智能领域的劣势。近日,英特尔官方表示,决定在年底正式挺入GPU市场,推出 Xe-LP GPU。
这一场战争,英伟达将打得很艰难。
(编辑:郭璇)