Skip to main content
首页 > 新闻资讯 »正文

浪潮团体副总裁胡雷钧:数据爆炸与庞杂模型给AI盘算带来更多翻新机遇

新闻资讯 adminsk 2017-10-12 22:43:58 查看评论 加入收藏

原题目:浪潮团体副总裁胡雷钧:数据爆炸与复杂模型给AI计算带来更多创新机会

作者:胡雷钧,系浪潮集团副总裁

随着人工智能首次写入政府工作讲演并且国务院印发了《新一代人工智能发展计划》,人工智能工业被视作新的重要经济增长点,人工智能技术应用成为改良民生的新道路。可以说,以人工智能技术为代表的第四次产业革命扑面而来,以前所未有的方法对人们的生涯带来宏大转变,what,不要与卑劣为敌?

人工智能将重构所有行业

纵观人工智能近多少年的发展,可以察看到一个明显趋势就是人工智能和各行各业的衔接越来越亲密。从长期来看,人工智能领有令人难以相信的力气,将重构简直所有行业。

在搜索引擎业务中,无论是文本、图片搜索仍是语音搜索,我们会发明机器仿佛变得越来越聪慧;在医疗保健行业,人工智能对医学影像来说带来了很大的改变;在金融行业,人工智能在投资组合设计、金融产品营销以及金融保险保障领域都有应用;在汽车制作行业,谷歌、Uber、百度等科技公司以及戴姆勒、福特等众多的汽车厂商正在开发智能驾驶;在气象预报领域,人工智能的技术目前在雷达外推短临预告上已得到应用;在石油勘察领域,神经网络和含混逻辑相联合被胜利应用到了裂隙性油藏的剖析,以及抉择最佳的测井数据对油藏特点进行研讨之中。

AI技术发展:大数据+大模型+大计算

人工智能在今天得以快捷的发展,跟数据、算法、计算的发展非亲非故。

目前,全球数据量正以均匀年增长率50%的速度增长,预计到2020年全球数据总量将超过40ZB,而2020年中国的数据总量将占全球数据总量比例的20%,成为世界第一数据资源大国和全球数据核心。

同时,人工智能深度神经网络也在疾速的发展,更深更大的算法模型、更庞杂的架构正在成为趋势。卷积网络曾是最大最深的神经网络架构之一,但现在,它被形象成了大多数新架构中的一小局部。

最后,数据的增大、模型的复杂,将为计算带来更大的挑衅空间,当如斯宏大的数据用于人工智能的练习学习时,数据量将超越内存跟处置器的承载上限,假如计算力不能相应增加,全部学习进程将变得无比漫长,甚至完整无奈实现最基础的人工智能

AI盘算迎来更多翻新机遇

从人工智能的三因素来看,如何更好的将爆炸式增长的海量数据用于模型训练,已成为人工智能将来发展的要害环节。数据与模型的倏地发展,为计算带来了挑战的同时,也供给了更多的创新机会。

那么在人工智能计算立异方面,则应从强调构建AI体系才能与价值着眼,在硬件创新、软件实现、框架优化和利用加速4个维度赋能AI,这四个维度构成了一个完全的“4S”组合:硬件创新是“Server”,加上软件实现形成“System”,再加上框架优化就是“Solution”,最后加上运用加速等于“Services”,这也是浪潮今年提出的AI端到端解决计划。

复杂的人工智能应用环境是进行人工智能硬件创新开发时要考虑的重要因素。人工智能在模型训练时对计算需要大更依附GPU,盈利靠广告收入?变卖粉丝?揭秘共享纸巾如何盈利!,而当产品服务上线后,计算需求减少,吞吐量需求增大,要斟酌低延迟的产品。今年,浪潮与百度在AI计算上结合开发的SRAI整机柜服务器,就是依据百度的AI模型训练需求开发的。我们将CPU和GPU离开成两个BOX,CPU主要负责治理和把持,GPU重要负责AI运算,通过专用的线缆将2个部门高速的连起来,跟着模型复杂度的增长和范围的增加,计算量会增添,如果一个GPU BOX不够的话,就可以扩展多个GPU BOX。目前,咱们开发的这款SRAI整机柜服务器可以实现单节点16卡、单物理集群64卡的超高密度扩大能力,已经应用在百度无人车之中,具备千亿样本、万亿参数级别的AI计算能力。同时,在前端推理方面,浪潮、科大讯飞和Altera公司独特发动了一项基于FPGA在智能语音识别范畴的配合,三方实现了基于OpenCL的FPGA线上深度学习语音辨认加速方案。

在AI系统管理方面,深度学习的模型训练往往流程较长、开发环境较复杂,波及数据筹备和处理、特征工程、建模、调参等多个步骤及多个框架和模型,每个框架依赖环境不同且有可能穿插使用。更大的“痛点”在于,深度学习模型在训练时往往耗时较长,短则数小时长则数天,以往在训练完成后才意识到模型存在问题,光大小周末之原来生涯满100元减30元,大大消耗了用户的精神和时间。浪潮根据此需求设计开发的AIStation管理软件可以提供从数据预备到分析训练成果的完整深度学习业务流程,支撑Caffe、TensorFlow、CNTK等多种计算框架和GoogleNet、VGG、ResNet等多种模型,有效的进步计算资源的应用率和出产率,为深度学惯用户提供高效易用的平台。

深度学习框架可以辅助用户更好更快的开发深度学习模型,浪潮主导开发的全球首个集群并行版的Caffe深度学习计算框架CaffeMPI,目前已在Github上开源颁布所有代码。在基于国际通行的Imagenet数据集进行深度学习模型训练时,CaffeMPI表示出良好的并行扩展,其机能是Google最新深度学习框架TensorFlow的近两倍。

AI应用优化是浪潮极为器重的一项中心能力。浪潮与奇虎360协作发展了针对图片搜寻技术的GPU架构移植,基于Kmeans无监视聚类算法串行版本,完成GPUMPI集群版本的实现,节点内应用CPU+GPU协同计算,大幅下降了计算时光。

人工智能是当前人类所面对的最为主要的技巧社会变更,能够全面晋升一个国家的实力,寰球很多国度都对AI充斥了向往与盼望。中国作为快速成长的数据资源大国,并且持续多年景为全球服务器增长最快的市场,在发展人工智能上具备得天独厚的数据上风与计算优势,这将让中国有能力成为人工智能的技术强国、应用大国。

(《中国电子报》版权所有,转载请注明出处)