找到9个数据集

格式: ZIP

过滤结果
  • CED:篇章目录结构树抽取

    目录作为篇章中天然的结构化信息,可以快速定位目标信息所在的片段。本项目旨在提供一系列从篇章中抽取目录结构的数据集和工具。
  • 基于知识图谱的多模态类比推理数据集

    ICLR2023“Multimodal Analogical Reasoning over Knowledge Graph”提出的数据集,包含一个多模态知识图谱数据集MarKG和一个多模态类比推理数据集MARS,用来评估模型的多模态类比推理能力。
  • 人物百科知识图谱

    该知人物识图谱以百度百科为基础数据集自顶向下构建而成,抽取分析其中的人物部分,总共包含人物实体2,480,097个,数据包含原始页面,图谱三元组(包括人物属性和人物关系)以及本体。数据可以辅助人物相关应用、问答系统等,目前第一版只考虑了利用了文本部分数据,后续会进行多模态数据的更新。
  • 红楼梦人物关系

    There is no description for this dataset

  • 87万通用领域实体概念描述三元组

    87万实体概念描述知识库,基于开放文本挖掘而成,格式为[实体/概念,描述体,置信度],...
  • TechKG_Applications

    TechKG_Applications是由“东北大学-...
  • TechKG10

    TechKG10是从TechKG中抽取的子集,共包含38个领域,由“东北大学-知识图谱研究组”开发完成。抽取规则如下:1)领域术语的tf*idf在前10%;2)每个实体至少出现在10个三元组中。
  • 国内主要中文百科知识图谱之间的链接数据集

    链接的中文百科知识图谱是OpenKG正在从事的一项工作。目的是促进百科类、通用域的知识图谱的开放与互联。目前已经初步建立了国内几个主要中文开放百科类知识图谱的链接,这包括Zhishi.me(狗尾草科技、东南大学)、CN-DBPedia(复旦大学)、XLore(清华大学)、Belief-...
  • 回答集程序(Answer Set Programming)求解器groc

    回答集程序(Answer Set Programming),简称ASP,是一个描述性编程语言(Declarative Programming Language),是人工智能知识表示领域中最重要的几个语言之一。很多知识并不适合用经典一阶逻辑(First-Order...