-
BTC2019数据集: Billion Triple Challenge 2019 Dataset
BTC数据集是从2018/12/12到2019/01/11使用LDspider进行大规模RDF爬取的数据,数据以四元组的形式存储,第四个元素编码相关联的三元组从web文档解析的位置。数据集包含了2,155,856,033个四元组,... -
基于cnSchema的浙江历史人物知识图谱
原始数据是从浙江省数据开放平台获取,通过构建schema,和数据预处理最终形成了基于cnSchema的浙江历史人物知识图谱。 《浙江历史名人》专题数据库所收浙江人物,除浙江籍的历史名人外,也包括了浙江旅外人士和外地长期在浙江工作并作出突出贡献者。时间跨度,上溯春秋战国,下延20世纪末收入人物3万多人。... -
基于cnSchema的浙江宗教团体知识图谱
原始数据是从浙江省数据开放平台获取,通过构建schema、数据预处理等最终形成了基于cnSchema的浙江宗教团体知识图谱。本数据记录了浙江省各地级市中宗教团体/协会的基本信息。... -
基于cnSchema的浙江旅行社(企业)知识图谱
原始数据是从浙江省数据开放平台获取,通过构建schema和数据预处理等操作最终形成了基于cnSchema的浙江旅行社(企业)知识图谱。主要是旅行社(企业)的基本信息数据。... -
OpenKG 精选文章汇编(2020 年度)
2020 年我们总共分享了 144 篇文章,其中原创文章 69 篇,内容涵盖了知识 图谱的方方面面,包括开源开放、领域应用、技术动态、论文浅尝、会议研讨等 多个主题。截止目前,公众号总订阅数已达 3.1 万人,全年累计阅读量达 58 万 +,累计阅读人数达 41 万+。 今年的汇编我们分解为“论文浅尝”、“开源开放”和“技术前线” 三个... -
《大词林》开源75万核心实体和围绕核心实体的细粒度概念、关系列表
开源了《大词林》中的75万的核心实体,和该核心实体对应的细粒度概念词(共1.8万概念词,300万实体-...