十年磨一剑,AI落地惊人,这样的“智能语义理解大脑”才够炫

2019-10-12 19:59发布

【猎云网北京】10月12日报道(文/奇点)

在人机交互技术方面,目前业界仍在进行多方面的探索和尝试,在人机交互的技术分类中包括:基本交互技术、图形交互技术、语音交互技术及体感交互技术等。其中语音交互技术不仅在AI中是重中之重,在智能语音上也扮演者重要的角色。

目前智能语音在个人市场、行业领域的应用场景也得到了快速扩展,用户对相关语音产品使用时长及粘性也明显提升。其主要领域涵盖了教育、汽车、医疗、家居、客服、手机、个人语音助手等多个领域。

而个人语音助手被产业界视为潜在的用户流量入口,包括科技巨头、新兴厂商均全力布局于此,但就及整个智能语音技术来说,其自身也面临着难以突破的技术瓶颈:语义理解技术。

从语言的本质来讲,语言的开放性使得计算机难以准确理解人类语言所表达的真实意图,这也造成了相应的落地产品在应对需要逻辑驱动的功能层面表现较为乏力。

而在人机交互领域中,不乏许多以垂直领域和细分场景为突破口的后起之秀,据猎云网了解,深思考人工智能机器人科技有限公司(简称:深思考)便是其中一个值得借鉴的案例。

打造多模态语义理解大脑,将AI赋能多应用场景

深思考是一家专注于类脑人工智能与深度学习核心科技的AI公司,核心团队由来自中科院、清华的一线AI科学家与领域业务专家组成。

公司核心技术聚焦于“多模态深度语义理解与人机交互技术”,目前在中文语义理解、多轮人机交互和机器阅读理解方面均取得突破。

同时近日华为旗下的哈勃科技投资有限公司也向深思考“抛出绣球”,据天眼查显示:华为旗下哈勃科技投资有限公司投资了深思考。

能够吸引到华为这种“大厂”的青睐,一方面,说明华为的人工智能生态正在逐步构建;另一方面,也说明深思考在人工智能的某一领域应该拥有着绝对核心竞争力。

就目前从整个AI产业界来看,最早实现产业化的是语音识别,接着是视觉、图像识别,最后才到语义理解,在语义理解技术中,同行的大部分友商基本还停留在单模态化——即图像、文本、语音不能同时兼顾的技术状态下。

而在这方面,深思考将全部的力量集聚在“多模态深度语义理解”上,此引擎技术可让机器能够同时理解文本、图像视觉等多模态非结构化数据背后的深度语义。

如果用负责表达和获取信息的眼耳口鼻来比喻“语音技术”,那么“语义技术”就相当于人的核心大脑。对于多模态深度语义理解技术,深思考将其视为传统语音、图像识别的进一步理解和融合。

在整个学术界乃至可预见的未来,语义理解技术都将以“多模态化”走下去,深思考此次也正是走在了语义理解发展的最前沿道路上。

一方面,深思考不断打磨多模态语义理解技术的多场景落地,整体战略布局紧扣人、车、家三大模块,研发了智慧医疗、智慧汽车、智慧生活、智能手机等解决方案,涉及从AI医疗到智能家居等多个应用场景。

据深思考创始人&CEO杨志明透露:“一个能让AI真正落地的场景,其实是贴近了我们的日常生活”。

事实上,若只用App去遥控开窗帘、关灯,这种传统的智能家居并未能解决人们的刚需,也并不是每一个家庭都需要一个智能音箱,家庭中真正需要的是一个虚拟的“中央语义理解大脑”。

传统的人机交互在对话体验感上是远远不够的,是因为这种简单的语音指令只能“听的见”,由于在语义理解上的缺失,还未能做到真正理解特定场景下用户的意图。但深思考通过多模态深度语义理解技术,在智能家居场景下,通过与用户进行“人性化的交互”,真正可以理解用户在家庭中的语义娱乐、生活健康、膳食营养等实际需要,这好比一个家庭中央的AI服务。

另一方面,深思考将深度语义理解技术应用于智慧医疗领域,开发iDeepWise.AI4.0宫颈癌辅助筛查系统,实现了大规模医疗筛查场景中AI的落地应用。

宫颈癌筛查的重点是在数量繁多、形态各异的细胞中识别出具有诊断意义的异常细胞,深思考通过“多模态深度语义理解”,综合分析单个细胞特征和细胞间的关联性,有效提升了异常细胞的识别准确率。

据猎云网了解,杨志明曾在“2019WISE超级进化者”大会上表示:“这就是语义理解,就是我能看懂这句话及这个图像背后的含义。

其次,他在汽车领域也打造了一个“智能场景”,为汽车配置了一个深度语义理解的大脑。推出了基于AI多模态深度语义理解引擎打造的智能交互机器人。将车内车外场景相融合,为用户提供一站式出行生活服务。

其中,AI多模态深度语义理解技术在车内应用有着四大特点:

1、AI引擎与RPA(机器人流程自动化)结合大大减少了用户在简单工作上消耗的时间,提升了车内人机交互体验。例如当AI通过场景理解,识别到用户正在上班途中,即可为主人自动播报工作安排,并实现自动预订会议室,会餐地点、机票酒店等安排。具体到订餐场景时,深思考的解决方案通过机器人自动调用餐厅的预订接口完成预定,避免了中间人工预订可能会产生的误解和麻烦,从而实现了一站式的服务。

2、车辆与智能家居信息融合同步。深思考通过车载系统与智能家居的链接,实现了对智能家居的远程控制,同时,在用户日程安排上,该公司的产品也能够通过语音进行提醒,并为用户提供适合的建议或决策。

3、关联意图的推荐和理解。对于出行过程中的场景,深思考的智能交互机器人会进行主动的识别与理解,并对下一个场景进行推测。当抵达某一地点时,AI会自动判断下一个目的地是停车场还是酒店等场景,并根据V2X的信息为用户进行智能导航和推荐。

4、车路协同、车车协同智能交互。对于行驶过程中前方的路况以及周围车辆的驾驶行为,深思考的解决方案也会进行实时的感知和理解。当前方发生交通事故,拥堵缓行或是周围车辆存在变道倾向时,AI会通过语音的方式对用户进行提醒,以防止意外的发生。

深思考在基于智能车联网的数字座舱场景下,通过车内摄像头和语音传感器,实现了多模态非结构化信息的深度语义,而且具备自由跨域上下文理解和多轮对话交互的能力。这相当于赋予了汽车一个智能语义理解的大脑,使得你的数字座舱会更加智能、更加懂你。

同时,多模态语义理解也可以用来赋能汽车的营销,它会将用户的对话信息、线上咨询等综合起来做多模态语义理解,最后再对用户进行建档、数据分析,以帮助汽车厂商扩大用户的流量入口,以便他们可以更好的去了解用户画像和利用AI帮助主机厂商提高销售转化率。

目前深思考已为奇瑞捷途提供技术支持,今年还将有几家大品牌厂商、及数千家4S店会应用到深思考的落地产品及解决方案。

人机交互“多轮多”,越交互越了解

在人机交互系统中,类似“siri”这种人机助手的交互形式大都以“单轮问答”——即一问一答模式进行。

但深思考在人机交互方面已经做到机器与人之间的“多轮问答”人机交互:意图的准确识别、上下文的精准理解、个性化特征的深入提取,从而在抓住用户真正意图的同时,实现多轮人机交互。

同时据猎云网深入了解,深思考在人机交互上最大的特点是能够实现“自由跨域”——即对用户的“大白话”进行意图理解,让机器更具人性化:根据不同用户的个性化特点,提供不同的交互流程。在这个过程中,不断的对“交互对象”进行了解,以达到“越交互越了解”的程度。

深思考独特的“自由跨域”技术实现离不开其团队研发的内核级技术——多轮对话管理引擎。这套引擎旨能够对“对话过程”进行监督、管理、追踪,通过模拟人的记忆方式,采用深度学习的一些算法模型去设计,确保机器的长短时记忆。

就算法来看,行业内很多做语义理解的友商还在用基于统计学的机器学习算法来做语义理解,深思考在这里已经是“长辈”了,目前深思考团队聚焦最为前沿的语义理解技术,诸如:BERT、XLNET、ALBERT,进行商业化落地。

目前深思考整个公司主要聚焦于ToB,就目前针对手机终端应用场景,与手机厂商做深度战略合作,未来也可能会利用这些场景在ToC端做一些探索。

杨志明说:“当下整个AI发展的现状就像一部不受青睐的电影:瞩目的导演拍出了一部巨作,但看的人往往寥寥无几。因为现在一个真正的AI公司,其核心团队往往来自学术界,而学术界几乎都发源于‘实验室’的场景下,这也会导致许多公司在初期不太注重产业化落地。”

而深思考则在创立之初就保持了技术投入和商业落地并驾齐驱的状态。

“十年磨一剑”,AI产业化未来可期

AI不同于其他行业,在一个团队中,“核心人才”是关键。深思考不仅具有精良的技术团队,同时具有强大的商业化基因和对应用场景的理解力

其核心团队主要来自于国内的核心AI发源地:内部成员由来自中科院自动化所、软件所、计算所、微电子所等中科院院所、清华大学及海外知名大学人工智能方向的一线AI科学家与领域业务专家组成,多人曾在AI领域内连续创业,在商业化产业落地的脚步上从未停止,这一路走来也收获了满满的经验。

团队的重心都一直是人工智能领域中一线前沿的科学家,且他们在深度语义理解、计算机视觉和深度学习处理器等方面拥有多项发明专利,具备深厚的技术积累。

杨志明表示:“实际上,我们在人工智能领域中已经深耕了十多年,包括此前多次的创业经历,这为我们积累了很多的场景化语料和数据,这使得我们的技术不断迭代进化,商业落地的考量也更加成熟。”

不可否认,杨志明和其团队历经十多年的技术沉淀,凭借“多模态深度语义理解与人机交互”技术,深思考的确构建起了坚固的技术壁垒,如今可谓是厚积薄发,十年磨一剑。

据猎云网从深思考侧面了解:在深思考成立之前,杨志明在AI路上已经历了三次创业,从第一次创业将AI与信息安全相结合的尝试到将AI用于法律垂直行业的第三次创业,中间还穿插了一部AI加广告推荐的插曲。

杨志明曾说:“多次的创业经历让我充分的意识到了技术必须要实现到具体产品的落地,所以一直也都在将技术积累和领域业务相结合去创业”。

直到2015年,杨志明的第四次创业——成立了深思考人工智能机器人有限公司,那时的AI刚在国内悄然兴起,可谓生正逢时。

从时间的长度及领域的宽度来讲,杨志明的创业经历从一定程度上横跨了国内AI的发展历程,这使得他更懂得如何将将AI规模化、产业化的实现落地。

AI在发展过程中一定是从感知到认知,亦或者是从感知到理解,随着5G、物联网的发展,无论是从落地还是技术、数据壁垒、算力布局上讲,深思考在人工智能领域的未来都值得令人期待。

文章来源: https://www.toutiao.com/group/6746870335485788679/