三大场景方案，58项预置技能，百度大脑智能对话引擎如何定义AI新篇章

2019-05-19 19:47发布

站内文章 / 前端开发

30 0

做个烂人

女 | 书童

私信

今天（5月17日），百度公布了2019年第一季度的财务报告，数据显示，本季度百度营收241亿元人民币(约合35.9亿美元)，同比增长15%，剔除分拆业务对收入的影响，同比增长21%。

值得关注的一点是，本次财报显示归属于百度的净亏损为3.27亿元，上年同期归属于百度的净利润为67亿元。

这是百度自2005年8月5日登陆纳斯达克后，第一次出现季度亏损。

不过，在百度在自动驾驶与智能对话领域迎来全新“热点”，国外知名研究机构Navigant Research发布自动驾驶报告显示，百度Apollo在聚集众多国外头部玩家的榜单中，跃身全球自动驾驶“竞争者”行列，成唯一上榜的中国玩家。

北京发布中国首个自动驾驶路测成绩单《北京市自动驾驶车辆道路测试报告( 2018 年)》，百度凭借测试牌照最多、实际道路测试里程最多、测试场景覆盖最全、单车里程最优异四个维度获得第一名，其Apollo在北京的道路测试里程超出行业第二10倍以上。

百度自动驾驶总测试里程139887.7公里，排名第二的蔚来汽车总测试里程2415.3公里。

百度创始人、董事长兼首席执行官李彦宏表示：“百度的人工智能业务取得了突破性进展，其中，Apollo在北京的道路测试里程超出行业第二10倍以上，我们和长沙合作的自动驾驶出租车很快也将跑上街头。接下来，我们将继续抓住产业智能化机遇，进一步拓宽我们的业务领域和商业模式，加快业务发展。”

在智能对话领域，百度也是走在前沿的创新者。

在5月15日，百度举办的百度大脑智能对话引擎及产品发布会上，百度正式推出UNIT3.0全新升级版本。

UNIT是百度大脑对话系统定制平台，3.0升级版本包含9大核心特性，可为国内智能对话领域提供能力丰富、使用规模最大的智能对话定制平台。

百度自然语言处理部主任架构师孙珂介绍称，“UNIT平台已累计超460亿次的交互量，在应用中，从对话核心技术到一个场景化的真实对话系统落地，企业或个人开发者仍然面临着数据标注、知识整理、系统集成的高成本投入。基于此，百度大脑推出UNIT3.0版本，在搭建技能、构建知识和整合技能与知识三方面实现全面升级。”

搭建技能方面，百度给所有的开发者提供了两种获取技能的能力：预置技能与自定义技能。

预置技能顾名思义其实就是已经研发、集成好的技能，开发者可以直接获取这样的技能集成到自己的对话里面去，就可以一键获取到一个完备的对话系统的应答能力。

发布会上百度发布了58个积累自真实业务的预置技能，除了积累自真实的业务场景以外，预置技能还有两个非常独特的特色的技能：问答资源和百科、知道、文库等相关资源。

自定义技能更加适合于开发者业务场景的技能，百度提供了自定义技能的能力。

在这里主要提供的有问答技能和对话技能能力。

需要指出的是，孙珂这里还提到一个功能DataKit，它可以提供数据生产与标注的能力，主要提供三种类型的能力：一是帮助开发者自动的获取百度的样本；二是可以对这些样本进行自动的筛选；三是对这些样本进行自动的预处理，让它能够更便捷的被人工进行修缮和修正。

孙珂称，“百度内部通过很多的真实业务进行了实验上的对比，在近万条数据标注的量级下，我们可以把16人天的工作量压缩到2人天，平均的标注效率可以提升8倍，因此，我们的DataKit是一个可以大幅去提升样本的生产与标注效率的工具。”

构建知识方面，百度发布来了一个名为“我的知识”这样一个板块，它的主要功能是降低知识库的构建成本。

其中，工具问答知识库构建工具和图谱知识库构建工具组成“我的知识”板块。

工具问答知识库构建工具可以帮助使用者更加精确、快速的构建一个常见的问答对知识，简单来说就是把业务文档灌输到知识构建里面去，就可以自动的做问答对的抽取。

在使用过程中，可以进行人工校正。

图谱知识库构建工具可以帮助使用者去梳理复杂的知识，这是面向对话技能所提供的一个能力。

孙珂介绍称，“把期望能够把这些业务文档灌入到系统里面去，让这个系统自动的抽取出一些图谱的知识关系，并且最好能够和人工进行可视化的交互，对这些数据进行进一步的清洗和融合，进一步降低数据的处理成本。当得到了这样一个比较精确且完备的图谱知识库以后，我们还可以用我们的图检索的API与我们的对话技能进行一个快速的整合，这样我们就可以很快的得到一个非常完整的有问有答的对话系统了。”

整合技能是百度全新升级的模块，可以将“我的知识”板块接入到需要的对话系统里面去，通过单一的接口来满足多样化的对话需求。

现场孙珂列举了一个用户多使用场景案例，如果用户希望订机票、查天气、提一些问题，我们就可以通过一个技能与知识管理的模块，用统一的接口来响应这些能力。

值得一提的是，技能管理可以做到对话和问答技能可以整合，技能顺序可调，同时，还是可以让技能之间的全局记忆做到共享。

除此之外，发布会上百度还对语音技术平台全新升级，包括三大对话场景方案：分别是客服智能对话场景方案、消费电子智能对话场景方案和出行智能对话场景方案。

客服智能对话场景方案结合其呼叫中心的语音语义技术需求特点，推出全新的语音语义一体化中控，实现一次交互完成语音和对话理解服务访问同时，预置对话中打断、沉默、语义去噪能力可降低通话中的异常处理成本。

消费电子对话场景方案综合考虑其场景、资源的开放性，软硬件终端产品的多元化等特点，除了前面提到的沉淀至真实场景的58项预置技能和优质的信息与问答资源外，还开源了对话管理模块DMKit、对话中控模块USKit，它们具备与云端理解能力无缝对接，帮助开发者深度定制对话技能。

也支持公有云、虚拟私有域部署模式，提供完善的Android、iOS SDK接入方式，还可一键接入DuerOS和小程序等。

出行智能对话场景方案是面向出行场景专属定制的，拥有车载专属语音解决方案和车厂专属语义定制平台。

车载专属语音解决方案中有全套面向车载环境的语音唤醒、离/在线语音识别、风格发音和明星发音等语音合成声库以及声纹识别能力。

面向车载网络稳定性不可控特性，百度推出了包含导航、设备控制、多媒体、通信等高质量离线预置技能，高性能离线语义嵌入式SDK，也推出了支持出行场景离在线对话能力融合的框架。

综合而言，UNIT3.0进一步升级了技能与知识管理能力，帮助开发者整合对话、问答技能，接入知识，通过单一接口一站式满足复杂的对话系统研发。

而语音技术平台全新升级也解决了当下消费电子和出行邻域语音识别率低的痛点，未来或自动驾驶时代或是AI时代，但其智能语音是其最关键的入口。