问答 - 秒客网

图谱问答

根据问题，解析出三元组中的其中两个元素，查询第三个元素

例如：
<中国，首都，北京>

中国的首都是哪？
中国和北京是什么关系
北京是哪个国家的首都

大部分的问题还是以第一种情况为主，即查询object

挑战：
1、如何确定subject？
2、如何确定predicate？
3、使用subject和predicate去搜索KB，找到一系列三元组之后，如何确定哪个三元组是我们想要的。

例如：
<美国，总统，特朗普>
<美国，总统，拜登>

到底应该选择哪一个作为最终的答案

Entity Linking

Entity Linking指的是subject的识别，为了实现KBQA，我们要做的第一步是把问题中的subject实体（entity）给找出来，并且找到知识图谱中对应的entity，然后根据该entity的特征来回答问题。

Entity Linking非常有挑战性，主要有两个原因

Mention Variations：同一实体有不同的mention。（<科比>：小飞侠、黑曼巴、科铁、蜗壳、老科。）
Entity Ambiguity：同一mention对应不同的实体。（“苹果”：中关村苹果不错；山西苹果不错。）

针对上述两个问题，一般会用Candidate Entity Generation (CEG) 和Entity Disambiguation (ED) 两个模块来分别解决：
Candidate Entity Generation：从mention出发，找到KB中所有可能的实体，组成候选实体集 (candidate entities)
Entity Disambiguation：从candidate entities中，选择最可能的实体作为预测实体。

Candidate Entity Generation (CEG)

最重要的方法：Name Dictionary ( {mention: entity} )
哪些别名：首字母缩写、模糊匹配、昵称、拼写错误等。

CEG这部分，最主流也最有效的方法就是Name Dictionary，说白了就是配别名。虽然CEG很朴素，但作为EL任务中的第一道门槛，其重要性不言而喻。对于每一个entity，紧凑而充分地配置别名，才能保证生成的candidate entites没有遗漏掉ground truth entity。

具体的，要配置哪些别名，要用什么构建方法，往往取决于EL的使用场景。比如做百科问答或是通用文本的阅读增强，就很依赖于wikipedia和搜索引擎；但如果是某个具体的行业领域，就需要通过一些启发式的方法、用户日志、网页爬取，甚至人工标注的方法来构建Name Dictionary。
在这里插入图片描述
采用maximum matching的方法来做entity linking，具体可参考以下文章：Chinese Word Segmentation based on Maximum Matching and Word Binding Force 。

Entity Disambiguation (ED)

实体消歧时，不同场景的特征选取是非常重要的。总的来说，实体消歧的特征分为，context独立和context不独立的。

context独立：考虑mention到实体的LinkCount、实体自身的一些属性（比如热度、类型等等）。其中，LinkCount作为一个先验知识，在消歧时，往往很有用，比如当我们在问“姚明有多高？”时，大概率都是在问<篮球运动员姚明>，而不是其他不为人知的“姚明”。虽然context中完全没有包含篮球运动员这一信息，但LinkCount最高，选其作为实体进行查询，都会是一个不错的答案。

context不独立：我是实际上是在计算条件概率 P(e|m,c) ，其中 c 是输入文本，e 为实体， m 是mention，因此可以直接对该条件概率建模。也可加入一些先验知识，例如LinkCount信息

1、直接把mention和context作为输入，经过神经网络做一个分类
2、采用一些图算法，计算entity embedding，计算相似度

predicate预测

Predicate的预测有两种方法
1、和图谱构建很类似，做一个分类
2、把predicate和问题进行对比，找出最相似的那个predicate

KBQA

A Chinese Question Answering System for Single-Relation Factoid Questions
http://tcci.ccf.org.cn/conference/2017/papers/2003.pdf 在NLPCC 2017的比赛中获得了KBQA的第一名

http://tcci.ccf.org.cn/conference/2019/papers/183.pdf
同时使用QA和QA模型来解决Knowledge Base QA问题。

2018年NLPCC
http://tcci.ccf.org.cn/conference/2018/dldoc/CFPtaskr1.pdf

CCKS2020

http://sigkg.cn/ccks2020/?page_id=700

问答