您现在的位置是:首页 > 人工智能人工智能
中科大王杰教授:基于表示学习的知识图谱推理技术
cc博主2022-01-17【人工智能】566人已围观

作者 | 维克多
编辑 | 青暮知识图谱蕴含丰富的人类先验知识,具有重要的学术价值和广泛的应用前景。知识图谱推理作为知识图谱领域的核心技术,能够极大地扩展现有知识的边界,有力地辅助人类进行智能决策。2021年12月17日,中国科学技术大学教授,博士生导师,国家优青王杰在 CNCC 2021 “知识为意,图谱为形--基于图机器学习的知识推理”专题论坛上做了《基于表示学习的知识图谱推理技术——从简单推理到复杂推理》的报告。在报告中,王杰结合知识图谱近年来的研究趋势与应用场景,聚焦从单一图谱推理到联合外部信息推理、从结构化输入到自然语言输入的层次递进的推理场景,介绍基于表示学习的知识图谱推理方向取得的进展。最后,王杰展望了知识图谱推理技术未来发展所面临的若干挑战和机遇。例如,他提到:“当前广泛使用的数据集无法准确地反映真实场景模型,现在的模型测试时基本采用封闭世界假设,不符合真实应用场景,会导致本该正确的结果被判断为错误……现有知识图谱只涉及文本信息,未来的发展趋势是扩展到多模态信息。多模态知识图谱依赖于多种模态数据的收集,其中关键问题是……”以下是演讲全文,AI科技评论做了有删改的整理:今天的演讲题目是《基于表示学习的知识图谱推理技术——从简单推理到复杂推理》,分为背景介绍、简单推理、复杂推理、未来展望等四个部分。
知识图谱的本质是大规模的语义网络知识库,表示对客观世界实体的描述。如上图左下角人物知识图所示,每一个节点代表一个人物,边代表人物之间的关系。而在计算机中,知识图谱以三元组的形式存储,包含头实体、关系、尾实体。我们总希望得到大型的知识图谱,因为在规模效应的作用下,会给应用效果带来质变。知识图谱可以分为两类,一类是通用知识图谱,面向通用领域的百科知识库,另一类是领域知识图谱,面向特定领域的行业知识库。

通用知识图谱覆盖面较广,但所包含的知识层级体系较浅、粒度较粗、精度不高,领域知识图谱则相反,其覆盖面较窄,只面向某个特定领域,包含的知识深度和精度往往有更高的标准和质量。知识图谱最早可以追溯到60年代的专家系统,当时主要是依靠专家知识,通过人工进行构建,所以成本较高。经过多年发展,知识图谱逐渐转向自动化构建,1998年提出的语义网络和2006年提出的链接数据是“自动化”发展的关键节点。2012年,谷歌发布知识图谱,并将其应用到搜索引擎当中。这时knowledge graph词汇第一次被明确提出。目前,谷歌、百度等构建的知识图谱已经包含超千亿级别的三元组,其背后所依赖的是大数据驱动下的自动知识获取技术。




- 建模关系间的语义结构,给定实体关系未在训练模型中出现过。
- 建模复杂的结构化问题,包含若干个一阶逻辑。
- 建模非结构化问题,输入数据包含人类口头语等。
简单推理最新进展

语义近似



语义分层




语义融合




复杂推理最新进展复杂推理主要集中在归纳式推理、多步推理、自然语言查询三方面的工作。



多步推理
复杂结构化问题的输入对应的复杂推理形式是多步推理。例如,对于查询任务“列出安徽省内为211但非985高校的校长”,对于这一任务,可以通过传统构建计算图方法进行解决,但会遇到结构多样、与或非逻辑运算等问题,从而带来非常高的计算复杂度。


自然语言查询
自然语言查询的难点在建模非结构化问题,其任务针对给定的自然语言问题作为输入(区别于结构化查询),通过知识图谱多跳推理的方式给出答案。但随着问题跳数增加,候选实体数量呈指数增长。现有的GNN方法通过子图裁剪以降低候选实体数量但牺牲了正确答案的召回率。

未来展望在知识图谱上进行推理,除了基于表示学习的方法之外,还有一种基于规则的方法。虽然基于表示学习相比规则推理的方法,可以更好地建模知识图谱中的潜在语义信息,但在真实的应用场景中,规则推理往往更受欢迎。原因是:它的精度高,可解释性强。因此,接下来,学术界的目标应该是使表示学习推理模型在真实场景下的性能与规则推理模型媲美。另一方面,学术界模型评测应更加全面高效,以指导模型的设计使之更契合真实场景的需求。下面我从数据集和评测指标两方面进行讨论。


推荐阅读
2021-12-25

2021-12-17

2021-12-23

雷峰网雷峰网(公众号:雷峰网)
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
Tags: