-
BTC2019数据集: Billion Triple Challenge 2019 Dataset
BTC数据集是从2018/12/12到2019/01/11使用LDspider进行大规模RDF爬取的数据,数据以四元组的形式存储,第四个元素编码相关联的三元组从web文档解析的位置。数据集包含了2,155,856,033个四元组,... -
海洋鱼类百科知识图谱数据
海洋鱼类的栖息地知识图谱数据,包含鱼类的属性信息,适用于图数据库。 -
装备知识图谱
本知识图谱研究的是装备知识,包含各类型装备、武器、兵器,装备数据的有效组织与存储,是构建智能化装备知识系统的重要基石。大量的装备属性、装备间关系等数据具有重要的研究与应用价值,然而由于缺少有效的数据组织与存储结构,在面对海量、分散的装备数据时,相关人员难以快速准确地获取装备信息,因此促使我们开展装备知识图谱构建的研究。 -
吴门书画知识图谱
吴门书画知识图谱是以吴门画派为主题的书画领域知识图谱。 以《吴门画史》中记载的1200余位吴门人物为中心,收集人物、书画和印鉴等信息。 人物数据主要来源于《吴门画史》,CBDB和百度百科等互联网数据。书画数据源于《中国古代书画图目》等专业书籍,博物馆网站。 团队介绍 万静,通信作者,博士,副教授,主要研究领域为知识图谱、文化遗产数字化保护,... -
公文知识图谱 (Official Document Knowledge Graph)
Copyright 2023 by Nanjing University of Posts and Telecommunications. Time: 2/6/2023 Authors: Wenbo Zhou & Weizhuo Li & Bianyu Yang Mail: b20090724@njupt.edu.cn &... -
中文多模态命名实体识别数据集
Wukong-CMNER,一个多模态NER数据集包含图像和文本的语料库。有55423个注释我们语料库中的图像-文本对。本数据是由华为发布的Wukong数据集标注得到,感谢华为公司允许对数据进行标注。 -
工业信息安全知识图谱相关
包括1.网络安全等级保护基本要求,和ics相关的部分 2.美国工控漏洞数据集 3.cwe,cve,capec数据集 -
imp知识图谱
imp数据构建三元组 -
安卓API关联关系知识图谱及挖掘分析
基于安卓API级别14-29官方文档,逐文档提取包、类、方法、权限四类实体 针对结构化文本直接解析关系,针对非结构化文本,采用基于模板匹配的关系抽取:人工提取关系匹配模板,逐句进行自然语言处理中的单词主干提取、实体名称规范化等操作,进行关系匹配,获得函数关系、类关系、继承关系、使用参数、返回值、抛出、替代、条件、指代、使用权限等十类关系... -
郑渊洁相关
There is no description for this dataset
-
基于cnSchema的浙江历史人物知识图谱
原始数据是从浙江省数据开放平台获取,通过构建schema,和数据预处理最终形成了基于cnSchema的浙江历史人物知识图谱。 《浙江历史名人》专题数据库所收浙江人物,除浙江籍的历史名人外,也包括了浙江旅外人士和外地长期在浙江工作并作出突出贡献者。时间跨度,上溯春秋战国,下延20世纪末收入人物3万多人。... -
基于cnSchema的浙江宗教团体知识图谱
原始数据是从浙江省数据开放平台获取,通过构建schema、数据预处理等最终形成了基于cnSchema的浙江宗教团体知识图谱。本数据记录了浙江省各地级市中宗教团体/协会的基本信息。... -
基于cnSchema的浙江旅行社(企业)知识图谱
原始数据是从浙江省数据开放平台获取,通过构建schema和数据预处理等操作最终形成了基于cnSchema的浙江旅行社(企业)知识图谱。主要是旅行社(企业)的基本信息数据。... -
KG-Buddhism
KG-Buddhism is an effort to build Chinese knowledge graph on Buddhism. It is collected from Zhishi.me and completed by property value pairs extracted from online unstructured... -
运维知识图谱
冶金企业的行车设备的故障运维知识,大类实体3750、小类实体942、实体属性300、实体关系1027、带有类别标签的三元组1086。 后续将继续增加,尽请期待! -
需求文本数据
标注了不可验证需求、不完整需求、模糊需求等需求文本中常见的表述缺陷问题。 -
DuIE2.0中文关系抽取数据集
DuIE2.0是业界规模最大的中文关系抽取数据集,其schema在传统简单关系类型基础上添加了多元复杂关系类型,此外其构建语料来自百度百科、百度信息流及百度贴吧文本,全面覆盖书面化表达及口语化表达语料,能充分考察真实业务场景下的关系抽取能力。 -
OntoNotes5.0数据集
开源图谱评测数据 -
CoNLL2003数据集
开源图谱评测数据 -
YAGO3-10知识表示数据集
开源图谱评测数据