[论文]知识图谱关系学习模型综述

<div class="blogpost-body" id="cnblogs_post_body">
<h2>原文 : A Review of Relational Machine Learning for Knowledge Graphs</h2>
<h2>1. Introduction</h2>
<ul><li>Statistical Relational Learning<br>目的 : 预测边, 预测node的属性, 对node进行聚类</li><li>与KB的结合
<ul><li>从既有事实中推理出新的关系</li><li>结合信息抽出的方法, 从语料库中抽出新的"noisy" 事实(即无法百分百确定的事实.)</li></ul></li><li>章节结构</li></ul>
<ol><li>介绍知识图谱和其属性(第二章)</li><li>讨论SRL相关和将其应用到KB的方法.(第三章)</li></ol>
<ul><li>利用潜在变量找到nodes/edges之间的关系.(第四章)</li><li>根据图的统计信息直接找到nodes/edges之间的关系.(第五章)</li><li>上面两种方法的结合(第六章)</li><li>将上面各种model如何在KG上训练(第七章)</li><li>利用马尔科夫随机场的推理(第八张</li><li>如何将SRL应用于知识图谱构建(第九章)</li><li>现有模型的扩展.</li></ul>
<h2>2. KNOWLEDGE GRAPHS</h2>
<p> <img alt="" class="origin_image zh-lightbox-thumb lazy" src="https://201907.oss-cn-shanghai.aliyuncs.com/cs/5606289-9f0c94792755f8a3ff9faee987367308.jpg" width="539"></p>
<h2>2.1 Knowledge representation</h2>
<p>知识图谱的基本结构是 SPO : (subject, predicate, object) (SPO) triples</p>
<p>比如:</p>
<p> <img alt="" class="origin_image zh-lightbox-thumb lazy" src="https://201907.oss-cn-shanghai.aliyuncs.com/cs/5606289-a4cc8a7b500fb262d78b58a02ad962be.jpg" width="435"></p>
<p class="ztext-empty-paragraph"> </p>
<p>这个就叫做知识图谱, 有时候也叫作异质信息网络.</p>
<p>知识图谱有一定的规则:</p>
<ul><li>Type具有层级性. (Type 包括 Entity Type和Relation Type)</li><li>Type之间包含着约束. (包括Entity Type和Entity Type之间的约束, Relation Type和Entity Type之间的和 Relation Type和Relation Type之间的)</li></ul>
<h2>2.2 Open vs. closed world assumption</h2>
<ul><li>Closed world assumption : KB是完美的, 没有错误.</li><li>Open world assumption : KB中含有很多没有的链接.</li></ul>
<h2>2.3 Knowledge base construction</h2>
<p>注意这里是知识图谱的构建, 而不是补全. 进行了以下的分类:</p>
<ol><li>Curated approaches : 专家构建</li><li>Collaborative approaches : 志愿者参与构建(常识性的关系)</li><li>Automated semi-structured approaches : 从结构化文本中进行构建的知识库. 通常具有相当高的正确率</li><li>Automated unstructured approaches : 从非结构性文本中利用机器学习构建. 这个就是关系抽出的任务, 在第九章讲.</li></ol>
<p><img alt="" class="origin_image zh-lightbox-thumb lazy" src="https://201907.oss-cn-shanghai.aliyuncs.com/cs/5606289-6879dcad500aa5aad982d877449a1cd7.jpg" width="447"></p>
<p>知识图谱还根据 Entity和Relation的选用范围是否被限定来对KB进行分类.</p>
<ul><li>schema-based : Entity和Relation都是固定的.</li><li>schema-free : Entity和Relation都没有确定. 是开放的, 但是有一个坏处是, 这里是按照字符进行储存的, <br>会造成信息重复, 比如在这里, (“Obama”, “born in”, “Hawaii”), (“Barack Obama”,“place <br>of birth”, “Honolulu”), 会被当做两个完全不同的triple来对待.</li></ul>
<p>这篇文章我们聚焦于schema-based Knowledge Base.</p>
<h2>2.4 Uses of knowledge graphs</h2>
<p>一些应用, 包括指代消解, 信息去冗余, QA.</p>
<h2>2.5 Main tasks in knowledge graph construction and curation</h2>
<p>几个经典的Knowledge Graph构建任务</p>
<ul><li>Link prediction( knowledge graph completion) : 即预测已经存在的边, 这个能力可以用来发现未知的边.</li><li>Entity resolution: 由于Entity具有层级性, 如果将同属于高一级的低级node合并, 其关系却不能合并, <br>这样Knowledge Graph就会存在多个相同的点, 而在给定具体的句子时我们需要确定句子中实体在Knowledge <br>Graph中的位置.例子见下图, 其中 A.Guinners是高级node, 其可以代表 Arthur Guinness 和 Alec Guinness:</li></ul>
<p> <img alt="" class="origin_image zh-lightbox-thumb lazy" src="https://201907.oss-cn-shanghai.aliyuncs.com/cs/5606289-7e74b984b9914162781287963b095ff1.jpg" width="1059"></p>
<ul><li>Link-based clustering<br>就是说根据link来对点进行分类, 比如社交网络中的团体分类.</li></ul>
<h2>3. SRL For Knowledge Graph</h2>
<h2>3.1 定义</h2>
<p>Statistical Relational Learning : 是指利用关系数据的统计模型, 并没有指定问题.</p>
<p>接下来的分析基于Knowledge Graph的种类是 :</p>
<ul><li>Open world assumption : Knowledge Graph中所有信息都是已知的(和没说一样), 但是triples中还有未完成的链接和噪声.</li><li>Entity和Type会由于层级性的存在, 存在重复. 如2.5.2 所示.</li></ul>
<p>这一章的主要内容是对Knowledge Graph进行数据建模.</p>
<h2>3.2 Notation</h2>
<p>这里的符号过于多, 但是都很容易懂, 看论文即可.</p>
<h2>3.3 Probabilistic knowledge graphs</h2>
<p>这一节重要讲了建模的方法.</p>
<p>如果采样三阶tensor的方法, 每个位置都是0/1的方式去储存Knowledge Graph的话, 那么要求的时间复杂度和空间复杂度都

[论文]知识图谱关系学习模型综述

浏览过的版块