找到65个数据集

分类: 常识

过滤结果
  • 海洋鱼类百科知识图谱数据

    海洋鱼类的栖息地知识图谱数据,包含鱼类的属性信息,适用于图数据库。
  • 北京大学图数据库-gStore

    一种基于图的RDF存储和SPARQL查询系统(triplestore);支持标准的RDF数据n3文件导入;标准SPARQL 1.1查询语句(含Union, Optional,...
  • 东南大学大型多模态知识图谱OpenRichpedia

    OpenRichpedia是一个大型多模态知识图谱,其包含的多模态知识可以应用于自然语言处理,计算机视觉与知识图谱等诸多研究领域。我们在本资源中提供了OpenRichpedia中的图片和知识资源,供研究者下载和使用。
  • SentiBridge: 实体/属性-情感词表

    实体/属性-情感词对定义:实体/属性—情感词 例如:“长城 宏伟”、“性价比 高”、“价格 高” 详细信息请阅读 readme.txt
  • CED:篇章目录结构树抽取

    目录作为篇章中天然的结构化信息,可以快速定位目标信息所在的片段。本项目旨在提供一系列从篇章中抽取目录结构的数据集和工具。
  • IEPile

    IEPile:大规模信息提取语料库 这是论文 IEPile: Unearthing Large-Scale Schema-Based Information Extraction Corpus 的官方仓库...
  • 百科知识图谱具有100W_en的实体

    处理了同义词,添加了唯一性标签,基于neo4j导出的csv,不要使用office打开,会乱码的,使用程序提取更好一些。 链接:https://pan.baidu.com/s/1LhZ7YUKsHVhsfJIXZB9GhA?pwd=9m15 提取码:9m15
  • 基于知识图谱的多模态类比推理数据集

    ICLR2023“Multimodal Analogical Reasoning over Knowledge Graph”提出的数据集,包含一个多模态知识图谱数据集MarKG和一个多模态类比推理数据集MARS,用来评估模型的多模态类比推理能力。
  • MulType

    MulType is a knowledge base describing the types of instances from multilingual Wikipedia. MulType is built by a language-independent approach, which can be used in any...
  • Linked Open Schema

    Linked Open Schema is an effort to build web-scale schemata from popular sites, which include existing categories with hierarchies and tag clouds. This project is maintained by...
  • ACE实体关系数据集

    开源图谱评测数据
  • 人物百科知识图谱

    该知人物识图谱以百度百科为基础数据集自顶向下构建而成,抽取分析其中的人物部分,总共包含人物实体2,480,097个,数据包含原始页面,图谱三元组(包括人物属性和人物关系)以及本体。数据可以辅助人物相关应用、问答系统等,目前第一版只考虑了利用了文本部分数据,后续会进行多模态数据的更新。
  • 2014年NLPCC实体链接数据集

    NLPCC 2014 评估任务测试数据
  • 2015年NLPCC实体链接数据集

    该任务来自NLPCC 2015评测任务,该任务的目标是对短queries中的实体进行识别并链接到对应的中文知识库中。本数据集包括一个中文知识库,该知识库来自各类中文百科的信息框,包括中文维基百科和百度百科。该数据集还包括每个实体页面的第一段作为该实体的摘要。
  • 知识工厂实体链接数据集

    基于CN-DBpedia的短文本实体链接测试数据 数据集的文本由1037条人工标注的短文本语料组成。其中大约70%来自新闻语料,包括新闻标题和内容,比如“英超-桑切斯4分钟内梅开二度阿森纳3-2五轮不败”;大约20%来自人工构建的基于歧义实体的语料,比如“红楼梦的演员有哪些”;大约10%来自问答语料中的简单问句,比如说“岳阳有哪些旅游景点”。
  • CEC事件抽取数据集

    开源图谱评测数据 中文突发事件语料库是由上海大学(语义智能实验室)所构建。根据国务院颁布的《国家突发公共事件总体应急预案》的分类体系,从互联网上收集了5类(地震、火灾、交通事故、恐怖袭击和食物中毒)突发事件的新闻报道作为生语料,然后再对生语料进行文本预处理、文本分析、事件标注以及一致性检查等处理,最后将标注结果保存到语料库中,CEC合计332篇。
  • 红楼梦人物关系

    There is no description for this dataset

  • 明代历史知识图谱

    项目设计并实现了明代历史知识图谱,涵盖了明代历史的重要人物、历史事件、历史地名、著作等若干实体,并实现了知识图谱的可视化展示。