对话戴金权:英特尔如何构建软硬件协同统一的大数据分析+AI平台?

2019-05-28 18:57发布

雷锋网消息,在2019全球人工智能技术大会主论坛,英特尔高级首席工程师、大数据技术全球CTO戴金权发表了题为“如何构建统一的大数据分析+AI平台”的演讲,英特尔的硬件能力不必赘述,这次英特尔则着重展示了软硬协同能力,尤其是人工智能开源软件平台Analytics Zoo。

戴金权表示,英特尔致力于提供从设备端到边缘再到数据中心、云端完整的计算架构,比如在数据中心,英特尔至强系列服务器是AI应用分析的基础架构,同时也提供了多种神经网络处理器等硬件架构。

英特尔开源AI软件版图

如上图所示,这是英特尔使用开源AI软件加速开发的版图,他强调,英特尔致力于提供全栈的解决方案,从最底层的算法开源项目帮助用户更高效开发计算库,再到上层各种机器学习或者深度学习的框架,再到最上层,英特尔也提供了一些开源工具包,目的是帮助应用开发人员更高效的开发基于深度学习的应用。

趋势 | 大数据分析和AI平台融为一体

据雷锋网了解,业内大数据分析和AI平台产品并不少,英特尔这类将大数据分析和AI平台融为一体的模式正成为行业新趋势。

第一,对于大多数用户来说,尤其在生产系统当中,基于Apache Spark这样的大数据集群仍然是所有的生产数据以及包括大量硬件资源的聚集地,如何更高效利用生产数据以及硬件资源,能够将新的人工智能的应用支持起来成为新挑战。

第二,要构建一个工业级端到端的大数据分析+人工智能应用,并不是说训练一个模型就可以完成的事情,其是一个非常复杂的流水线或者工作流。从数据的收集、导入、处理、特征的提取、各种模型的构建训练,到最后的部署、推理等等,是一个非常复杂的工作流。

“我们能够帮助用户可以将这一个样端到端的大数据处理分析加上机器学习的工作流能够非常方便地构建出来,从而大大能够提高了用户的开发效率、部署效率和运维效率”,戴金权介绍道。

与过去数年相比,深度学习和人工智能应用场景更加广泛,要处理的数据也更加广泛,所以客观要求使用者构建端到端的大数据处理分析加上机器学习、深度学习的统一流水线。英特尔观察到,客户有越来越多的类似需求。

“我们有很多用户是来自于很多非常大的互联网公司或者是大的企业里面的传统实验室,他慢慢的也会发现,当构建了一些人工智能深度学习的框架和模型之后,怎么样能够很好的真正跑到生产系统上去,能将生产数据在上面跑起来。这是用户来使用英特尔Analytics Zoo一个很重要的出发点。”

此外,Analytics Zoo的用户也不乏硬件的OEM的厂商、软件提供商、公有云服务商等,英特尔现场展示出的客户包括浪潮、宝信、戴尔、阿里云和腾讯云等。

核心 | 端到端应用场景塑造

从深度学习模型到一个完整的工业级应用要多少步骤?如上戴金权在现场展示的PPT,黑色部分是核心的深度学习模型,但是周边有很多工作要完成,才能使之运行起来。

深度学习的模型只是整个流程的一部分,要构建和应用深度学习模型,还有数据的导入、数据清洗、特征提取、对整个集群的资源的管理和各个应用之间对这个资源的共享等,这些工作事实上占据了机器学习或者深度学习的一个工业级应用开发大部分的时间和资源。所以,数据处理、机器学习,以及算法必须很好地和现有的大数据处理的工作流整合在一起。

这也是构建一个端到端的应用场景所面临的问题,在没有一个统一的大数据分析+AI平台之前,需要人工把很多不同的框架拼凑起来。

另外很多用户开发一般都是从单机开始,当需要处理更多数据的时候,就需要跑到一个大规模分布式环境,甚至到一个生产环境里去。

从Analytics Zoo的角度,第一,英特尔能够将不同的框架无缝的集成到流水线里面去,通过在软件层上面各种新的支持或者功能,能够将TensorFlow、Spark能够非常无缝的集成在一个程序里面,在一个Spark程序里面直接嵌入TensorFlow的Code,然后一起运行起来,这其实对很多用户来说很有吸引力。

第二是在开发过程中,因为底层运行在Spark这样的引擎上,上面可以嵌入各种深度学习的功能,它可以运行在一个单机的环境,也可以跑到一个分布式环境里面去,用户也可以直接访问生产数据。

“很多用户之所以想用Analytics Zoo,就是它可以直接构建端到端的,跟生产系统几乎一致的原型。这是我们的一个主要出发点,可以帮助用户将整个的大数据分析+人工智能的应用很方便的将端到端的流水线构建出来,而且它可以很方便的从用户的笔记本运行到集群、运行到用户的生产环境当中去,这是英特尔在底层Analytics Zoo这个平台里所做的工作”,戴金权总结道。

Analytics Zoo是为了大数据平台所优化的,今天大数据平台基本都运行在非常大规模的英特尔至强处理器上,或许是几十、几百、几千个节点,但是英特尔使用了大量的底层优化的框架和库,像MKL-DNN、OpenVINO等等,将来会通过英特尔One API这样的生态系统输出。

戴金权提到,当在英特尔的生态系统上构建一个人工智能开发平台时,带来的好处就是底层能够支持英特尔各种硬件的加速,不管是至强服务器,包括像Movidius、FPGA,神经网络处理器,还有将来的独立显卡,都可以通过One API下面的底层生态系统来给上层的平台和应用所使用。

雷锋网总结,Analytics Zoo能够将各种不同的模块不同的框架下统一到一个端到端流水线上,提高客户开发部署大数据分析和深度学习的能力,这在如今深度学习或者机器学习越泛化的背景下十分重要,英特尔的工作能够让用户减少人工智能应用的开发环节,快速推向现实场景。

英特尔高级首席工程师、大数据技术全球CTO戴金权已经确认出席由中国计算机学会主办,雷锋网、香港中文大学(深圳)联合承办的CCF-GAIR全球人工智能与机器人峰会。

2019年7月14日,CCF-GAIR 2019 将结合语音、计算机视觉等传统人工智能重点方向的研究,以及如在经济学等领域的新应用,承接历史与未来、学术研究与产业应用,对世界和中国近四十年来的人工智能研究进行一个系统性的回顾并展望在当前复杂国际形势下中国人工智能的未来发展。

超链接:CCF-GAIR 2019 大会官网

文章来源: https://www.toutiao.com/group/6696020026836648459/