Top
首页 > 正文

因为“天上掉馅饼”,浪潮拿下AI服务器市场半壁江山

后来的事情,大家都知晓,英伟达的GPU成为全球AI计算力代言,而浪潮的HPC团队在2017年变成了AI&HPC团队,深耕AI服务器市场,短短几年便成为全球第一大AI服务器供应商。 有人问,今天浪潮的AI服务器已经占据了整个市场50.
发布时间:2020-01-17 09:33        来源:电子信息产业网        作者:李佳师

在充满不确定性的地方中碰到确定性,在不会掉馅饼的地方被馅饼砸中,往往都是小概率事件。

“天上会不会掉馅饼?答案是可能会。英伟达的GPU就是被Hinton教授和ImageNet比赛的‘馅饼’给砸中。而浪潮十几年前就和英伟达一起基于GPU+CUDA来做HPC,所以当浪潮从HPC赛道进入AI服务器赛道时,也被AI的馅饼‘砸’中了。” 浪潮集团AI&HPC总经理刘军说。因为当天的采访是在一个茶室,所以刘军谈得也比较放松,关于AI计算业界这几年发生的事,关于浪潮与BAT的AI,关于未来的AI计算,刘军分享了不少“干货”。

英伟达和浪潮AI的因果?

有人说,浪潮信息在最近这些年的发展中,被两个馅饼“砸”中了,一个馅饼是互联网服务器,因为一直贴身服务于成长中的BAT等中国互联网企业,发展出了JDM模式,成为全球最大的互联网服务器供应商;另一个馅饼是AI服务器,在2019年上半年浪潮AI服务器出货量占据全球第一,在中国AI市场占据50.2%市场份额。关于浪潮互联网服务器的故事大家都知道,但是关于AI服务器是如何被馅饼砸中的,外界知之甚少。

这几年,浪潮信息的核心关键词是智慧计算,浪潮认为“计算力就是生产力”。这次采访中刘军将该观点进行了新演绎,认为“人工智能计算是未来核心的计算力”。

而要谈AI计算力,英伟达是一个绕不过去的话题。英伟达是AI时代计算力增长的红利获得者,这是业界公认的事实。因为其GPU在2012年被深度学习之父Hinton采用,去参加了大规模视觉识别挑战赛(ILSVRC)而一举夺冠(ILSVRC就是斯坦福大学AI实验室主任李飞飞缔造的ImageNet图像识别比赛),从此奠定了GPU在人工智能训练市场的核心地位,让英伟达的股价一骑绝尘一直飙升。

事实上,英伟达的命运是在2012年、2013年开始改变的,从一直做HPC到后来HPC+AI,不断过渡到AI市场。因为2012年的ILSVRC比赛以及2016年AlphaGo与李世石比赛,让英伟达的GPU名声大噪,于是GPU成了做深度学习的“标配”。

现在大家谈英伟达都把焦点放在GPU身上,但其实还有一个功臣,CUDA软件平台功不可没。因为这个计算平台,让英伟达培育起开发者生态,因为CUDA让GPU的能力释放出来。“而在2012年之前,英伟达其实已经默默耕耘CUDA计算平台达5~6年之久。估计英伟达公司内部也有不少人抱怨,还要不要继续做CUDA?投入那么久,也没有看到多大的回报,因为它主要是针对高性能计算(HPC)领域,而这个市场又不大。” 刘军透露说。

虽然GPU性能很好,但是没有足够多的软件,所有的软件要从CPU搬到GPU上,就得重写软件,而当时会用CUDA的开发者很少,于是当时身份为浪潮集团HPC总经理的刘军有了一项很重要的工作——带领HPC团队每年给行业客户进行CUDA培训,同时帮助行业客户写CUDA 软件,这样的贴身服务于石油、勘探、气象、生物等行业客户,让浪潮积累了大量的行业经验和需求。”也是在那个时候,包括华大基因、奇虎360等客户找到浪潮的HPC团队,说我们能不能一起合作将CPU上的翻译、基因库、安全等应用改到GPU上去跑?因为客户的变化,于是浪潮HPC也就一只脚跨到了AI上。”刘军说。

后来的事情,大家都知晓,英伟达的GPU成为全球AI计算力代言,而浪潮的HPC团队在2017年变成了AI&HPC团队,深耕AI服务器市场,短短几年便成为全球第一大AI服务器供应商。

这段关于英伟达与浪潮的“往事”揭示了几个关键信息:一是很多在外界看起来是“天上掉馅饼”的“时来运转”,其实都经历了很长时间的“至暗时刻”。只是外人没有看到,被馅饼砸中的人,通常都热身了很久。二是在计算产业领域,每一个成功技术和产品的背后,似乎都和“生态”是否蓬勃发展有关,在英伟达身上如此,在浪潮身上也如此。

浪潮在AI领域去年最大的动静是推出“元脑生态计划”,围绕这个计划,浪潮打造了AI计算、AI资源、AI计算工具三大平台,构建了“左右手“AI生态(左手是指有AI功能开发能力的科技公司,右手是指有AI落地和交付能力的公司)。

AI时代有免费午餐?

在一个技术领域里,是否参与“尺子”的定制,往往决定了一个企业在产业中的地位是主导还是被动跟随。

“每一个领域,都有一些可衡量的尺子,这些尺子规范的建立对一个产业的成熟和蓬勃发展非常重要。尺子定得好与不好,会把大家引导到不同的方向上,或是良性,或是畸形。”刘军说。

就像HPC领域的全球超算TOP500排行榜,Linpack测试就把全球超级计算机产业推向异常发展态势。刘军说:“因为基于Linpack测试来进行全球超级计算机TOP500的排名,带来的结果是各国为了争夺这个排名,争相投巨资建设能排名第一的机器。”这就成了大家做超级计算机的“尺子”,但是其实这个尺子并不能很好引导行业朝着更好应用HPC的方向发展。

到了AI计算时代,也应该有一个新的尺子来引导行业的发展。虽然目前在AI领域已经有了谷歌、英伟达公司为主导的Mlperf测试基准,但是基准更侧重于芯片本身的性能,而事实上,用户使用的计算机是一个系统,并不仅仅是一个芯片,所以业界需要一个更侧重于计算系统的测试基准。基于此,浪潮加盟了由国际权威评测机构SPEC成立的机器学习技术委员会(简称SPEC ML),并担任首届委员会主席,Intel公司为秘书长,目前正在推动基于机器学习的测试基准规范制定。“从跟跑、并跑到领跑,浪潮希望走到领跑阵营主导产业发展格局。”刘军说。

也是基于此,浪潮与IDC第二次发布了《AI计算力发展评估报告》,希望为政府、社会、产业提供一些参考。

“天下有免费的午餐吗?有的。摩尔时代,摩尔定律就是免费午餐,在人工智能时代,计算力就是免费的午餐,你得大胆地去吃,才能够享受它带来的红利。一定要充分利用计算力这个资源,能够用计算力去完成的事情,就没有必要再用人去完成。” 刘军说。

浪潮AI与BAT的AI有什么不一样?

今天在中国市场有众多的AI玩家,包括以BAT为代表的互联网企业,也包括以浪潮等为代表的IT企业,还有大批的AI创业企业,大家的定位有什么不同?浪潮如何与BAT展开竞争?

刘军认为,从基于云来提供AI产业化服务角度看,BAT等公司侧重于基于公有云来提供AI服务,而浪潮则侧重于混合云的角度来提供AI服务。对于非常多的行业和企业客户,他们很在乎数据是存储于本地还是云上,会选择混合云的基础设施方式来获得AI能力、AI服务,在这个维度上浪潮是更合适的选择。

“其实浪潮与BAT之间并不矛盾,大家最终目的一样。比如百度是我们的客户,我们是百度的合作伙伴,BAT也是我们生态伙伴的一部分,他们会通过我的生态赋能往前走,最终实现产业AI化,大家是相互配合的关系。”刘军说,“大家并不是在小池塘里喝水,你喝了他就没得喝,而是在一个大江大海里喝水,根本喝不完。”

有人问,今天浪潮的AI服务器已经占据了整个市场50.2%的份额,接下来该如何进一步增长,接下来该如何做?刘军给出的答案是,如果这是小池塘,确实会感到有边界,水会被喝完,但其实这是个很大的市场,增长的空间和边界还非常大,而且需要更多的玩家一起把市场做大,把生态做大,把“AI计算力”这个免费的午餐做得更好吃,更容易吃,在这样的诉求下,有大量的事情需要做,现在才刚刚拉开序幕。

合作站点
stat