华为人机对话 的机器人叫什么

2023-04-10 12:18 综合百科 0阅读 投稿:小七

集微网消息,网络普及初期,有人说“你永远不知道,电脑那头是男是女”。如今,随着人工智能的发展,你可能也无法知道,电话那头的是不是机器人。

现在有许多公司都各自的推出了智能助手,如Apple Siri、Google Now、微软小娜(Microsoft Cortana)、Facebook M、百度度秘和微软小冰等等,这些智能助手能够与人进行简单的对话,并且完成一些基本的任务,但是现有的智能助手存在只考虑自动问答,对话中问题的回复具有准确率低的缺点。

华为在2016年7月提供了一种用于人机对话的方法、神经网络系统和用户设备,可以实现与用户进行自然语言交互,并且依据知识库作出基于事实的正确的自然语言答案。

该专利的方案包括先构建结构化知识库(本文简称为知识库)和训练数据。

此处的知识库是基于一些“事实”(facts)组成。结构化的知识库中包括记录(records)或者“元组(tuple)”。可以从互联网获取结构化知识库。

需要了解的是,知识库具体可以由多个三元组构成,也可以由包括多条结构化的记录的数据库构成,本发明实施例对此不作限定。以知识库由多个三元组构成为例,可以从百度百科、互动百科、豆瓣等百科知识网站抓取网页,并通过对网页中的表格解析得到结构化的三元组。

经过进一步的处理,例如可以包括去噪、合并等处理。最终抽取得到多个三元组,构成结构化知识库。如在训练过程中,可以逐一扫描上述“问题-答案”对数据,检查是否与知识库中的某个或多个三元组“匹配”,其中,“匹配”的定义可以是:1、三元组的元素出现在问题中;2、三元组的元素出现在答案中;3、三元组的元素不出现在问题中。

应理解,本发明实施例中,知识库的大小和训练数据的大小可以根据训练需要进行调整。在一个具体的例子中,结构化知识库中可以包括5.5M个三元组,“问题-答案”对可以包括132M个,从中选取出696K个“问题-答案”对作为训练数据。

在本发明实施例中,每个词可以对应一个独热(one-hot)向量。所谓独热向量是指,对于某种语言而言,共有A个词,对每一个词进行编号,任一个词对应一个独热向量,该独热向量具有M维,其中该词的编号对应的元素为1,其余的元素为零。独热向量为高维向量。

设输入的自然语言问题为序列x=(x1,x2,...,xT),即将自然语言问题分解为T个词,分别对应x1,x2,...,xT。xi为独热向量。

设输出的自然语言答案为y=(y1,y2,...,yT′),即自然语言答案为T′个词组合而成的,T′个词分别对应y1,y2,...,yT′。yi为独热向量。

三元组为t=(ts,tp,to),ts/p/o均为独热向量,分别表示三元组中的主语、谓词和宾语。

请参见下图,该专利的用于人机对话的方法包括以下步骤:


华为人机对话 的机器人叫什么图1


步骤S101中自然语言问题可以由用户通过麦克风等进行语音输入,也可以通过键盘、鼠标等进行文字或图形的输入,还可以是其它的一些输入形式,系统根据用户输入的自然语言问题能够转化为序列x=(x1,x2,...,xT)。

步骤S102中可以将自然语言问题作为神经网络系统的第一神经网络模块的输入,计算获得该自然语言问题对应的问题向量。具体地,用户输入的多个自然语言问题可以看作是多个长度变化的词序列x= (x1,x2,...,xT)。

步骤S103,以知识答案为三元组为例,则是获得与自然语言问题相关的至少一个三元组,其中,至少一个三元组与至少一个三 元组向量对应。

步骤S104仍以知识答案向量为三元组向量为例,可以将问题向量和至少一个三元组向量作为神经网络系统的第二神经网络模块的输入,计算获得基于结构化知识库的中间结果向量。

对于候选的三元组向量集合中的每个三元组向量t,其与问题向量的相似度通过如下方式计算:S(x,t)=qTMut,其中,上式中q为问题的向量表示H的分量,即q可以从H中得到。

步骤S105将问题向量和中间结果向量作为神经网络系 统的第三神经网络模块的输入,计算获得自然语言问题的自然语言答案。第三神经网络模块的作用为将问题向量与匹配结果的中间结果向量进行综合,并输出自然语言答案。

该技术方案提供了一种用于人机对话的方法,该方法通过将自然语言问题和知识库向量化,通过向量计算,将对话和基于知识库的问答结合,能够与用户进行自然语言交互,并且依据知识库作出基于事实的正确的自然语言答案,避免了现有技术只考虑自动问答,或只考虑自然语言对话,对对话中问题的回复具有准确率低的缺点。

华为就该技术方案在中国、欧洲、美国就该技术布局了专利,对应的公开号为:CN106844368A、WO2017092380A1、US20180276525A1。(校对/诗诗)

声明:若水百科所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系youzivr@vip.qq.com