遥远的监督:如何命名实体连接到的游离碱(KB)关系(distant supervision: how

2019-09-27 19:12发布

我试图创建一个遥远的监督语料库。 因此,到目前为止,我已经安装了数据,并通过它通过NER系统,所以你可以看到下面的例子。

原始数据:

<p>
Myles Brand, the president of the National Collegiate Athletic Association, said in a telephone interview that he had not been approached about whether the N.C.A.A. might oversee a panel for the major bowl games similar to the one that chooses teams for the men's and women's basketball tournaments.
</p>

加工与斯坦福NER:

<p>
<PERSON>Myles Brand</PERSON>, the president of the <ORGANIZATION>National Collegiate Athletic Association</ORGANIZATION>, said in a telephone interview that he had not been approached about whether the <ORGANIZATION>N.C.A.A.</ORGANIZATION> might oversee a panel for the major bowl games similar to the one that chooses teams for the men's and women's basketball tournaments.
</p>

现在,这里是包含了人的一句话Myles Brand和组织National Collegiate Athletic Association

在游离碱,我们有这两个实体共享的关系纽带President正如你可以看到:

游离碱的关系:

人们会认为下面的代码会做的伎俩, 在此基础上的问题 ,但实际上却没有,但正如你从图片中可以看到上面的游离碱似乎保持在自己的语料库这两个实体之间的关系。 这是什么,我做错了什么?

我一直在玩弄它在这里 。

[{ 
 "type" : "/type/link", 
 "source" : { "id" : "/en/myles_brand" }, 
 "master_property" : null, 
 "target" : { "id" : "/en/national_collegiate_athletic_association" }, 
 "target_value" : null 
}]

此外,我有好几千个实体对的,我想我可以写使用游离碱的Java API来找出所有这些反过来的关系,一些简短的Java程序,没有任何人有这样的,我可以采取程序的示例在偷看?

我想,虽然知道真实的事情是,一旦我有关系,什么是assosicate那些有距离监控语料库的最好方式,我感到困惑的时候终于它被结合在一起的这一切是如何看起来。

Answer 1:

你有一对夫妇的事物的游离碱方面的问题。 首先,迈尔斯·布兰德和NCAA之间的关系不是直接的,但由代表受雇的节点介导的。 此节点有链接到雇主,雇员,他们的头衔,开始日期和结束日期。 第二,反射查询具有比标准MQL查询更强的方向性和在这种情况下迈尔斯品牌为目标,而不是源。

此查询会告诉你链接到/business/employment_tenure节点:

[{
  "type": "/type/link",
  "source": {
    "id": null
  },
  "master_property": null,
  "target": {
    "id": "/en/myles_brand"
  }
}]

但它需要扩展来处理,你试图寻找(并提取标题)多跳的关系。

而不是做这个使用反射,你可以测试的关系直接,如果你已经有了一个足够小的组他们的是你感兴趣的内容。

例如,你可以测试雇佣关系(和取标题,如果有的话)使用:

[{  
 "/business/employment_tenure/person" : { "id" : "/en/myles_brand" }, 
 "/business/employment_tenure/company" : { "id" : "/en/national_collegiate_athletic_association" }, 
 "/business/employment_tenture/title": null
}]


文章来源: distant supervision: how to connect named entities to freebase (KB) relations