个人 - 机构 - 开放知识图谱

中文多模态命名实体识别数据集

Wukong-CMNER，一个多模态NER数据集包含图像和文本的语料库。有55423个注释我们语料库中的图像-文本对。本数据是由华为发布的Wukong数据集标注得到，感谢华为公司允许对数据进行标注。

CSV
TXT

工业信息安全知识图谱相关

包括1.网络安全等级保护基本要求，和ics相关的部分 2.美国工控漏洞数据集 3.cwe,cve,capec数据集

imp知识图谱

imp数据构建三元组

安卓API关联关系知识图谱及挖掘分析

基于安卓API级别14-29官方文档，逐文档提取包、类、方法、权限四类实体针对结构化文本直接解析关系，针对非结构化文本，采用基于模板匹配的关系抽取：人工提取关系匹配模板，逐句进行自然语言处理中的单词主干提取、实体名称规范化等操作，进行关系匹配，获得函数关系、类关系、继承关系、使用参数、返回值、抛出、替代、条件、指代、使用权限等十类关系...

ZIP

郑渊洁相关

There is no description for this dataset

CSV

DuIE2.0中文关系抽取数据集

DuIE2.0是业界规模最大的中文关系抽取数据集，其schema在传统简单关系类型基础上添加了多元复杂关系类型，此外其构建语料来自百度百科、百度信息流及百度贴吧文本，全面覆盖书面化表达及口语化表达语料，能充分考察真实业务场景下的关系抽取能力。

OntoNotes5.0数据集

开源图谱评测数据

CoNLL2003数据集

开源图谱评测数据

YAGO3-10知识表示数据集

开源图谱评测数据

TAR

WN18rr知识表示数据集

开源图谱评测数据

TAR

WN18知识表示数据集

开源图谱评测数据

TAR

FB15k-237知识表示数据集

开源图谱评测数据

TAR

FB15k知识表示数据集

开源图谱评测数据

TAR

鸟类百科知识图谱

本项目的知识基于中国环境与发展国际合作委员会生物多样性工作组补全的《中国鸟类野外手册》的电子版，以CHM 文件格式存储。该格式是微软于 1998 年推出的基于 HTML 文件特性的帮助文件系统，可以理解为HTML的打包文件。将CHM文件抽取出来，就能得到其中的HTML文本。...

CSV

大规模1.4亿中文知识图谱开源下载

知识图谱可视化：https://www.ownthink.com 本次ownthink开源了史上最大规模的中文知识图谱，数据是以（实体、属性、值），（实体、关系、实体）混合的形式组织，数据格式采用csv格式。使用方式见GitHub： https://github.com/ownthink/KnowledgeGraphData 下载方式：...

CSV

找到15个数据集