2019年中国人工智能大会(Chinese Congress on Artificial Intelligence 2019,简称“CCAI 2019”)将于在9月21日-22日在青岛胶州召开。
周志华教授是大会程序委员会主席之一。他从事人工智能研究20多年,研究领域包括人工智能、机器学习与数据挖掘等,是国内人工智能研究的代表人物。周志华教授目前担任南京大学人工智能学院院长,是人工智能相关五大主流国际学会的首位华人“大满贯”Fellow,还是欧洲科学院外籍院士。
近年来以深度学习为代表的人工智能取得了令人瞩目的发展,周志华作为该领域的世界级专家,有着怎样的观察和思考,又提出过什么样的学科洞见?让我们一起看看。
深度学习成功的三个秘诀
近年来人工智能的火热,离不开深度学习的几次突破,其中尤以围棋智能AlphaGo的横空出世为甚。它以压倒性优势先后横扫人类两大顶尖棋手李世石与柯洁,在收获一片惊呼与赞叹的同时,引发了人们对人工智能的能力边界,以及未来生活种种可能性的无限想象。
作为机器学习领域的世界级专家,周志华对技术的发展始终保持高度理性和清醒认知。他将当前机器学习的成功归于这三个因素:有效的深度模型、强监督信息以及稳定的学习环境。
有效的深度模型,在现阶段基本上就是深度神经网络。曾有人提出,神经网络不是新事物,早在半个世纪之前就有了,今天我们之所以能够做更深的神经网络,只不过是因为计算能力强,现在能够训练了。
周志华认为,这是一个认识误区。他指出,2006年之前学界并不知道如何训练出五层以上的神经网络,这不是由于计算能力约束,而是不知道如何设计有效的算法。图灵奖得主杰夫辛顿在这方面做出了重要贡献,使得训练更深的神经网络成为可能,这才有了后来深度学习的发展和繁荣。
第二个因素是存在强监督的信息。深度学习需要大量的样本,那么在今天这个大数据时代,样本是不是不成问题?
周志华解释说,不是的。仅有样本并不够,重要的是这些样本需要有标记,这将耗费大量的人力物力,机器学习技术对强监督信息是高度依赖的。
以AlphaGo为例,它使用人类职业六段以上的超过16万棋局进行训练,后来发明的AlphaZero不使用人类棋局,通过两个程序直接对弈来实现性能的提升,但这种模式同样依赖于强监督信息,因为它依赖于人类提供的胜负判断规则,而这个胜负规则本身就是一般应用任务里很难具备的非常强的监督信息。
稳定的学习环境对当前机器学习技术的成功同样不可或缺。在这样的环境中,学习过程涉及的数据分布、样本空间、学习目标都是固定的。
深度学习如何实现突破?
在周志华看来,任何一个模型都必然存在缺陷,深度神经网络也是。第一,它要求人们花费大量的精力调整参数;第二,现在使用的神经网络学习模型需要在训练前预先确定,但事实上,在解决一个现实问题之前人们并不知道什么样复杂度的模型是最恰当的。此外,对大训练数据的依赖、理论分析的困难、模型的黑箱性等等都不容忽视。
周志华指出,机器学习领域“没有免费的午餐定理”说明,不存在“包打天下”的模型,任何一个模型可能只有一部分任务是适用的。可以看到深度神经网络主要是在图像、声音等数值建模任务上性能卓越,但在涉及符号建模、离散建模、混合建模等的其他任务上并不突出,因此,有必要针对这样的任务特点来考虑设计神经网络模型之外的新型深度学习模型。
其次,当前的深度学习高度依赖于强监督信息,可是把现实生活中强监督样本需要付出巨大的代价,如何利用弱监督信息进行学习是重要研究方向。
最后,现在越来越多碰见的是开放动态环境,学习过程涉及的因素都可能发生变化。这对机器学习提出了更大的挑战。
因此周志华总结道,未来机器学习研究需要多关注:
- 神经网络外的新型深度学习模型;
- 基于弱监督信息的学习;
- 开放动态环境下的学习。
人工智能的人才培养
周志华坦言,从对人工智能学科的历史贡献来看,中国不仅比不上美国,也不及欧洲、日本。国际上五六十年代就开始了人工智能研究,而我国在1978年以后才恢复科学研究,起步太晚,人工智能研究在新世纪以来才开始与国际接轨。
他同时表示,近十年来中国人工智能取得了高速发展,如果仅从最近几年的发展情况来看,确实可以说目前中国在人工智能领域仅次于美国。
2018年,国内C9高校的首个人工智能学院在南京大学成立,周志华为首任院长。到2019年3月,已有35所高校获得首批建设人工智能本科专业的资格。
周志华认为,人工智能学院的涌现,是政策推动、产业发展、学科内涵多方共同作用的结果:首先,人工智能是时代关注的焦点,国家政府高度重视;第二,人工智能技术已经进入互联网、金融、智能制造等诸多行业,人才缺口非常大;第三,人工智能并不是一个短期热点,而是一个经过60多年发展的严肃学科,已经形成了庞大自洽的专业知识体系,全面掌握人工智能专业知识需要付出大量的学习时间和精力。
在人才发展方面,周志华提出,人工智能是个高度凸显“个人英雄主义”的行业。因为以往对人才培养来说,从“学”到“用”之间的间隔是天然存在的。以软件开发为例,现在几乎没有什么软件能够仅靠1、2个人完成,必须通过大团队合作,而学校主要是培养学生的个人素质能力,例如一门课考试不可能让几十个学生做同一张试卷然后同享得分, 学生在大团队中开展工作的能力必然要到企业才能培养发展。而人工智能行业则有所不同,它的“学以致用”性非常强,从高校培养出来的高水平人才可以很快在产业界发挥作用,周志华领导的LAMDA(南京大学机器学习与数据挖掘研究所)培养毕业的学生加入阿里、腾讯、华为很快就为公司取得重要突破性业绩,多名博士生甚至在读期间就被聘为知名企业研究院院长,就是明显的例子。周志华指出,人工智能领域从实验室成果到产业界应用的“路径”相当短,实验室里由于个别“聪明人”取得的算法突破往往很快就可以在产业应用中实施,甚至推进引领整个领域的技术发展。为了在人工智能时代加快我国科技和产业发展,高校在培养高水平人工智能人才方面可以多下功夫争取做更大贡献。