-
CED:篇章目录结构树抽取
目录作为篇章中天然的结构化信息,可以快速定位目标信息所在的片段。本项目旨在提供一系列从篇章中抽取目录结构的数据集和工具。 -
基于知识图谱的多模态类比推理数据集
ICLR2023“Multimodal Analogical Reasoning over Knowledge Graph”提出的数据集,包含一个多模态知识图谱数据集MarKG和一个多模态类比推理数据集MARS,用来评估模型的多模态类比推理能力。 -
人物百科知识图谱
该知人物识图谱以百度百科为基础数据集自顶向下构建而成,抽取分析其中的人物部分,总共包含人物实体2,480,097个,数据包含原始页面,图谱三元组(包括人物属性和人物关系)以及本体。数据可以辅助人物相关应用、问答系统等,目前第一版只考虑了利用了文本部分数据,后续会进行多模态数据的更新。 -
红楼梦人物关系
There is no description for this dataset
-
87万通用领域实体概念描述三元组
87万实体概念描述知识库,基于开放文本挖掘而成,格式为[实体/概念,描述体,置信度],... -
TechKG_Applications
TechKG_Applications是由“东北大学-... -
TechKG10
TechKG10是从TechKG中抽取的子集,共包含38个领域,由“东北大学-知识图谱研究组”开发完成。抽取规则如下:1)领域术语的tf*idf在前10%;2)每个实体至少出现在10个三元组中。 -
国内主要中文百科知识图谱之间的链接数据集
链接的中文百科知识图谱是OpenKG正在从事的一项工作。目的是促进百科类、通用域的知识图谱的开放与互联。目前已经初步建立了国内几个主要中文开放百科类知识图谱的链接,这包括Zhishi.me(狗尾草科技、东南大学)、CN-DBPedia(复旦大学)、XLore(清华大学)、Belief-... -
回答集程序(Answer Set Programming)求解器groc
回答集程序(Answer Set Programming),简称ASP,是一个描述性编程语言(Declarative Programming Language),是人工智能知识表示领域中最重要的几个语言之一。很多知识并不适合用经典一阶逻辑(First-Order...