人工智能论坛如今浩如烟海,有硬货、有干货的却百里挑一。由中国科学院大学主办,百度公司提供支持,读芯术作为指定合作自媒体的“AI未来说·青年学术论坛”第一期“数据挖掘”专场已于2019年1月19日下午在中科院学术会堂举行。来自中科院的刘强博士,为大家带来报告《深度学习时代的个性化推荐》。
刘强博士全场报告视频
刘强,瑞莱智慧联合创始人&研发总监,2018年博士毕业于中国科学院自动化研究所,微软学者奖得主,在AAAI、IJCAL、SIGIR、WWW、CIKM、ICDM、IEEE TKDE、ACM TIST等顶级会议与期刊发表多篇论文。
报告内容:随着信息时代的发展,人们往往被信息过载的问题所困扰,难以找到自己喜欢或需要的信息,个性化推荐的重要性越发凸显。不同于图像、语音等领域的应用,深度学习在推荐领域的应用面临着不一样的问题。基于深度学习的个性化推荐技术,核心在于特征的非线性交互表达学习。本讲将着重介绍个性化推荐技术不同层面的特征交互学习,以及现阶段所面临的问题和发展方向。
深度学习时代的个性化推荐
刘强博士讲的内容主要是深度学习和大数据技术背景下的个性化推荐技术,刘强博士的报告主要围绕以下几个方面进行。
刘强博士首先讲了什么是个性化推荐?即根据一个人过往点击过的、购买过、个人的喜好等信息来预测未来可能需要的东西,发掘潜在的喜好。以向某用户进行电影推荐为例,可以根据该用户以前看过哪些电影和该用户潜在的喜好的电影类型来进行电影推荐。
接着讲到了为什么要做个性化推荐?在信息爆炸和互联网高速发展的时代,有非常多的信息充斥着我们的生活,比如,购物、新闻、视频、社交等信息,量也是非常大的。我们面临着很严重的信息过载问题,为了从这些纷纭复杂的信息当中找到我们需要的、想要的、喜欢的信息,个性化推荐技术就应运而生,而且变得越来越重要。
然后讲到了个性化推荐的发展的历程。个性化推荐技术经历了四个阶段,分别为2000年左右根据热度、排行、分类这些简单规则的规则推荐阶段、2006年左右的基于姓名和矩阵分解的协同过滤模型的阶段、2010年左右的基于人工特征的广义线性模型阶段和2015年左右的基于深度学习算法和大数据的深度学习模型阶段。
刘强博士重点分享了深度模型阶段的技术,如数据挖掘中用到的数据、深度推荐模型。数据挖掘中用到的数据,即用户历史数据,可以完全用人类的知识构建的语义信息。深度推荐模型主要是特征的非线性表达学习,包括三个特征层面的组合,异质特征交互、同质特征交互、内容特征交互。重点介绍了同质交互模型和异质交互模型。
最后,刘强博士提到了现在的模型中存在的问题,比如,难解释或者不可解释,无法进行准确的描述,用户数据很复杂,异质数据的有效利用和数据量比较小等问题,并给出了相应的意见和建议。比如可以做很多半监督或者监督的工作,提升模型的可靠性。再就是知识的嵌入,把模型与知识图谱相结合,可以更好地提高模型的效率和稳定性。