-
石油勘探开发数据集
There is no description for this dataset
-
DuEE-fin金融领域篇章级事件抽取数据集
DuEE-fin是百度发布的金融领域篇章级事件抽取数据集,包含13个事件类型的1.17万个篇章,同时存在部分非目标篇章作为负样例。事件类型来源于常见的金融事件,数据集中的篇章来自金融领域的新闻和公告,覆盖了真实应用场景中诸多难以解决的问题。 -
2014年NLPCC实体链接数据集
NLPCC 2014 评估任务测试数据 -
OntoNotes5.0数据集
开源图谱评测数据 -
CoNLL2003数据集
开源图谱评测数据 -
知识工厂实体链接数据集
基于CN-DBpedia的短文本实体链接测试数据 数据集的文本由1037条人工标注的短文本语料组成。其中大约70%来自新闻语料,包括新闻标题和内容,比如“英超-桑切斯4分钟内梅开二度阿森纳3-2五轮不败”;大约20%来自人工构建的基于歧义实体的语料,比如“红楼梦的演员有哪些”;大约10%来自问答语料中的简单问句,比如说“岳阳有哪些旅游景点”。 -
YAGO3-10知识表示数据集
开源图谱评测数据 -
WN18rr知识表示数据集
开源图谱评测数据 -
WN18知识表示数据集
开源图谱评测数据 -
FB15k-237知识表示数据集
开源图谱评测数据 -
FB15k知识表示数据集
开源图谱评测数据 -
CEC事件抽取数据集
开源图谱评测数据 中文突发事件语料库是由上海大学(语义智能实验室)所构建。根据国务院颁布的《国家突发公共事件总体应急预案》的分类体系,从互联网上收集了5类(地震、火灾、交通事故、恐怖袭击和食物中毒)突发事件的新闻报道作为生语料,然后再对生语料进行文本预处理、文本分析、事件标注以及一致性检查等处理,最后将标注结果保存到语料库中,CEC合计332篇。 -
红楼梦人物关系
There is no description for this dataset
-
任天堂Switch游戏知识图谱
任天堂Switch(英语:Nintendo Switch,简称NS或Switch)是日本任天堂公司出品的电子游戏机。 本知识图谱包含任天堂Switch自发售以来登陆的所有游戏,与相关厂商、人物之间的关系,方便根据厂商或人物查询感兴趣的游戏。 数据来自中文维基百科。 -
明代历史知识图谱
项目设计并实现了明代历史知识图谱,涵盖了明代历史的重要人物、历史事件、历史地名、著作等若干实体,并实现了知识图谱的可视化展示。 -
英雄联盟宇宙知识图谱
《英雄联盟》(League of Legends,简称LOL)是由美国拳头游戏(Riot Games)开发、中国内地由腾讯游戏代理运营的英雄对战MOBA竞技网游。经过多年的发展,围绕英雄联盟这一IP已近发展出很多周边产业,英雄联盟宇宙便是其中之一。英雄联盟宇宙汇集了英雄们在一片名叫符文之地的魔法大陆上的传奇故事,大到世界观,小到地方的风土人情。 -
喜羊羊与灰太狼知识图谱
本项目以动画《喜羊羊与灰太狼》为例,构建其中角色的人物关系知识图谱。项目任务一共分为四个部分:1)数据爬取与预处理 2)命名实体识别 3)实体关系抽取 4)可视化与知识问答。 -
浙大人员数据集
贡献关于浙大导师的开放知识图谱,包含6455位导师的公开研究信息,以便广大报考学生找到最符合自己的导师。公开信息来自person.zju.edu.cn上的部分key-value数据,以及网络文本的提取。 -
英雄联盟职业和难度图谱
本项目聚焦于构建英雄和其角色的实体关系知识图谱。其中实体包括英雄、角色;关系包括英雄与角色的关系(属于某一阵营)、英雄与英雄的关系(兄弟姐妹等)。并提供Database-free的图谱可视化界面和一个简单的智能问答系统。 -
三国志立传人物关系图谱
《三国志》,二十四史之一,是由西晋史学家陈寿所著,记载中国三国时期的曹魏、蜀汉、东吴三国历史的纪传体断代史。本图谱梳理了《三国志》中立传人物的信息与关系,包含两种实体:人物,国家(三国及书中提及的少数民族国家)。两种实体都收集了较多的信息,并包括了人物间的亲属和人物与国家之间的从属两种关系。