-
中文多模态命名实体识别数据集
Wukong-CMNER,一个多模态NER数据集包含图像和文本的语料库。有55423个注释我们语料库中的图像-文本对。本数据是由华为发布的Wukong数据集标注得到,感谢华为公司允许对数据进行标注。 -
周杰伦歌曲知识图谱及在线查询系统
周杰伦(Jay... -
国内外TOP250电影作品知识图谱
我们基于国内外优秀影视作品,构建了一个关于其类型、主演、导演、上映时间的知识图谱。本项目运用了数据爬虫技术、深度抽取技术、知识图谱构建技术等关键技术,并在图谱上进一步实现了搜索、问答、挖掘等简单的应用。 -
陈奕迅音乐作品知识图谱
2022年年末,陈奕迅的歌迷们终于盼来了在香港红馆举行的陈奕迅《FEAR AND DREAMS》演唱会,在此背景下,我们构建了陈奕迅音乐作品知识图谱,以便对陈奕迅演唱的作品进行更加深入的了解和分析。... -
郑渊洁相关
There is no description for this dataset
-
浙江省文化站基础信息
来自于浙江省数据开放平台,并利用ChatGPT对文化站的交通消息进行了格式化与抽取。 -
喜羊羊与灰太狼知识图谱
本项目以动画《喜羊羊与灰太狼》为例,构建其中角色的人物关系知识图谱。项目任务一共分为四个部分:1)数据爬取与预处理 2)命名实体识别 3)实体关系抽取 4)可视化与知识问答。 -
鸟类百科知识图谱
本项目的知识基于中国环境与发展国际合作委员会生物多样性工作组补全的《中国鸟类野外手册》 的电子版,以CHM 文件格式存储。该格式是微软于 1998 年推出的基于 HTML 文件特性的帮助文件系统,可以理解为HTML的打包文件。将CHM文件抽取出来,就能得到其中的HTML文本。... -
大规模1.4亿中文知识图谱开源下载
知识图谱可视化:https://www.ownthink.com 本次ownthink开源了史上最大规模的中文知识图谱,数据是以(实体、属性、值),(实体、关系、实体)混合的形式组织,数据格式采用csv格式。 使用方式见GitHub: https://github.com/ownthink/KnowledgeGraphData 下载方式:... -
通用知识图谱(ownthink)
ownthink致力于最大的中文开放知识图谱,目前已经对两千五百多万实体进行了融合,拥有亿级别的实体属性关系,知识还在不断更新中。 数据集包含: 歧义关系(mention -> entity) 全部知识(entity -> knowledge) 属性值(entity&attribute -> value)... -
医疗知识图谱数据(ownthink)
知识图谱可视化检索:https://www.ownthink.com/knowledge.html 知识图谱数据使用方式见主页:https://www.ownthink.com/ 说明文档:https://www.ownthink.com/docs/kg/...