内容字号:默认大号超大号

段落设置:段首缩进取消段首缩进

字体设置:切换到微软雅黑切换到宋体

机器之心有幸在深圳追一科技总部对首席科学

2018-03-13 02:36 出处:未知 人气: 评论(0

  相比于语音和图像,自然语言是一个有「更多需求」和「更少标准答案」的领域。扎根自然语言的公司通常也不是从技术和方法出发,而是选择一个具体的需求,然后用所有可能的方法解决它。追一就是这样的一家公司,它瞄准的是「对话机器人」这个领域,把问题分类、分解、逐个建立准确高效的机器人,再有序集成起来。三月,机器之心有幸在深圳追一科技总部对首席科学家杨振宇进行了采访,我们仔细聊了聊「对话机器人是怎样炼成的」,以及在他眼里,深度学习与自然语言最好的结合方式是怎样的。

  对话机器人是一个相对比较复杂的系统,由许多个模块组成。其中最核心的模块就是语义理解,理解用户想要表达什么意思。而在利用深度学习处理商业对话机器人的语义理解问题方面,追一是国内最早的一家。

  根据服务类型,对话机器人可以分为FAQ咨询、资料查询、任务型和闲聊四种,涉及的自然语言处理问题也各不相同。

  咨询来说,模块的输出对应知识库里的一个知识点。解决问答就像解决一个大型分类问题,机器人要将用户的需求对应到知识库里的某一个答案。

  知识库里的知识点数量少则几百个,多则上万个。而根据知识库大小不同,适用的模型结构也会有所不同。例如,银行类客户通常有多个复杂的业务线,知识库规模也是数以万计,直接对几万个知识点进行分类是难以取得高准确率的,因此,机器人会采用分层处理的方法,先判定问题与哪一个大领域相关,再进行详细的知识点分类。

  公司」。成功获得这两个信息后,机器人会去一个结构化的数据库里做查询。得到答案后,按照一个预定义的格式化模板填充后返回给客户。

  资料查询的一个难点是,用户在连续发问时,不会每次都重复自己的意图和实体,比如用户会在询问「A

  公司的呢?」或者「那市净率呢?」。这时,系统就需要通过上下文管理,对意图和实体这些要素进行继承或切换。用户的提问到来之后,首先进行判断:用户在这一句中是否提供了某一要素?如果没有,则尝试从前文追溯继承;如果有,再判断用户是否进行了意图(实体)转移,如果是,则需要进行对应更新。

  另一个难点是,用户可能不会直接说出实体全称,无法进行精准的、科技新闻基于规则的匹配。因此,机器人需要结合特定用户的历史记录和用户群体的统计信息,通过学习的方法计算词与词之间转移的概率,然后进行模糊匹配。

  任务型对话是当下比较流行的一种交互形式,机器人试图以对话的形式来执行订机票、查账单、买理财等任务。任务型和资料查询类对话有相似之处:它们同样要从用户处获得两类信息:意图和「元素」。区别在于,确定意图后,任务型机器人需要主导对话:它要理清进行特定任务所必要的元素有哪些,并以对话的形式确保用户提供了所有元素。以订机票举例,用户说「帮我订明天北京到上海的机票」,那么机器人在明确了任务是「订机票」之后,就要理清,用户已经提供的元素有时间、出发地、到达地,尚未提供的元素有舱位偏好、时间偏好、特定机场偏好等。只有获得了全部所需元素,机器人才能「执行任务」。

  最后一类是闲聊,与陪护机器人的闲聊功能不同,穿插在查询、咨询问答或任务交互之间的闲聊,需要结合上下文一起识别。有时,一句话单独看是闲聊的意图,但结合上下文一起看则属于查询、咨询问答或任务交互的一部分。这种场景下的闲聊不仅要识别准,而且要保证上下文对话的流畅性,也非常有挑战。

  如前所述,系统是由FAQ咨询、资料查询、任务型和闲聊等不同类型的机器人组成的。除此之外,还有一个中控模块,是系统的管理控制中枢。

  中控负责依据用户当前问句和历史会话记录,初步判断当前问题应该由哪个机器人来回答,然后下发给一个或多个下游机器人。下游机器人处理后,将答案以及对应的置信度返回给中控,中控根据下游返回的信息进行决策后,将最合适的响应返回给用户。

  一种是「系统知道自己可能犯错」:某一请求虽然分配给了特定机器人,但是机器人给出的最佳回答的置信度仍然很低,换言之,该回答能够满足用户请求的可能性很。

分享给小伙伴们:
本文标签: 科技新闻

相关文章

评论

发表评论愿您的每句评论,都能给大家的生活添色彩,带来共鸣,带来思索,带来快乐。

签名: 验证码: 点击我更换图片

评论列表

    Copyright © 2002-2018 北京pk10走势图 版权所有|黔ICP备16006823号-1