OpenKG - 机构 - 开放知识图谱

BTC2019数据集: Billion Triple Challenge 2019 Dataset

BTC数据集是从2018/12/12到2019/01/11使用LDspider进行大规模RDF爬取的数据，数据以四元组的形式存储，第四个元素编码相关联的三元组从web文档解析的位置。数据集包含了2,155,856,033个四元组，...

基于cnSchema的浙江历史人物知识图谱

原始数据是从浙江省数据开放平台获取，通过构建schema，和数据预处理最终形成了基于cnSchema的浙江历史人物知识图谱。《浙江历史名人》专题数据库所收浙江人物，除浙江籍的历史名人外，也包括了浙江旅外人士和外地长期在浙江工作并作出突出贡献者。时间跨度，上溯春秋战国，下延20世纪末收入人物3万多人。...

基于cnSchema的浙江公共图书馆知识图谱

本数据是由“浙江省公共图书馆基本信息”和“浙江省公共图书馆地理信息”整理合并而成。二者的原始数据均是从浙江省数据开放平台获取，统一schema后，对两个数据集进行整理合并，最终形成了基于cnSchema的浙江公共图书馆知识图谱。...

基于cnSchema的浙江定点医疗机构知识图谱

原始数据是从浙江省数据开放平台获取，通过构建schema和数据预处理等操作最终形成了基于cnSchema的浙江定点医疗机构知识图谱。本数据是浙江省各医院、门诊等定点医疗机构的基本信息。本数据包含定点医疗机构名称,定点类别,机构编码,服务人群,地址等信息。其中“医疗机构名称”，“地址”等使用了cnSchema中的定义。提供json-...

基于cnSchema的浙江森林公园知识图谱

原始数据是从浙江省数据开放平台获取，通过构建schema和数据预处理等操作最终形成了基于cnSchema的浙江森林公园知识图谱。本数据是位于浙江省内的国家级、省级等森林公园基本信息。...

基于cnSchema的浙江宗教团体知识图谱

原始数据是从浙江省数据开放平台获取，通过构建schema、数据预处理等最终形成了基于cnSchema的浙江宗教团体知识图谱。本数据记录了浙江省各地级市中宗教团体/协会的基本信息。...

json-ld

基于cnSchema的浙江宗教场所知识图谱

原始数据是从浙江省数据开放平台获取，通过构建schema、数据预处理等最终形成了基于cnSchema的浙江宗教场所知识图谱。本数据记录了浙江省各地级市中宗教场所的基本信息。...

json-ld

基于cnSchema的浙江A级景区知识图谱

原始数据是从浙江省数据开放平台获取，通过构建schema、数据预处理等最终形成了基于cnSchema的浙江A级景区知识图谱。本数据记录了浙江省各地的A级景区基本信息。《浙江省A级景区基本信息》包含了景区名称，等级，地址等信息。其中“景区名称”、“等级”、“地址”等使用了cnSchema中的定义。提供json-ld，ttl，RDF和xml四种下载格式。...

基于cnSchema的浙江旅行社(企业)知识图谱

原始数据是从浙江省数据开放平台获取，通过构建schema和数据预处理等操作最终形成了基于cnSchema的浙江旅行社(企业)知识图谱。主要是旅行社(企业)的基本信息数据。...

OpenKG 精选文章汇编（2020 年度）

2020 年我们总共分享了 144 篇文章，其中原创文章 69 篇，内容涵盖了知识图谱的方方面面，包括开源开放、领域应用、技术动态、论文浅尝、会议研讨等多个主题。截止目前，公众号总订阅数已达 3.1 万人，全年累计阅读量达 58 万 +，累计阅读人数达 41 万+。今年的汇编我们分解为“论文浅尝”、“开源开放”和“技术前线” 三个...

PDF

新冠开放知识图谱.数据规范-Schema

这个是此次新冠图谱的数据规范要求，此数据集后续将集中发布各个图谱的Schema文件供大家重用。

XLSX
ZIP

OpenKG论文浅尝2019年论文汇编

OpenKG「论文浅尝」旨在通过分享近期知识图谱领域的论文笔记，内容涉及信息抽取、知识推理、知识问答、推荐系统、知识融合等多个方向。2019年共推送 90 篇「论文浅尝」，这本论文汇编是根据文章阅读量挑选出的其中20+篇笔记。特别感谢：整理「论文浅尝」笔记的来自浙江大学、东南大学、南京大学、天津大学、复旦大学的 40 多位同学。

PDF

webdatacommons数据集

越来越多的网站使用结构化的数据来表述一些比如商品、人物、组织、地点、事件或者菜谱等等。这些结构化的数据经常使用诸如RDFa，Microdata或者Microformats等格式存储。Common Crawl是现如今向公众开放的最大网络语料库，里面存有66 TeraByte的网页数据，而Web Data...

MIT - ConceptNet5的中文部分-截至2017年1月

OpenKG收集和整理国内国外重要的开放知识库和知识图谱项目，并组织整理相关的中文资料免费对外开放。 ConceptNet是常识知识库。最早源于MIT媒体实验室的Open Mind Common Sense (OMCS)项目。OMCS项目是由著名人工智能专家Marvin...

CSV

Deepdive：完善的知识抽取框架

OpenKG搜集和整理知识图谱相关的技术工具，并将组织开展技术评测。Deepdive是由斯坦福大学InfoLab实验室开发的一个开源知识抽取系统。它通过弱监督学习，从非结构化的文本中抽取结构化的关系数据，可以判断两个实体间是否存在指定关系。具有较强的灵活性，可以自己训练模型。

python

汉语开放词网(Chinese Open WordNet)

汉语开放词网(Chinese Open WordNet) OpenKG收集和整理国内国外重要的开放知识库和知识图谱项目，并组织整理相关的中文资料免费对外开放。汉语开放词网是受 Princeton WordNet 和 Global WordNet Grid 启发由 NTU Computational Linguistics Lab...

XML

中文词汇网路(Chinese Wordnet)

中文词汇网路(Chinese Wordnet) OpenKG收集和整理国内国外重要的开放知识库和知识图谱项目，并组织整理相关的中文资料免费对外开放。中文词汇网路 (Chinese Wordnet, 以下简称中文词网) 计画，目的是在提供完整的中文词义 (sense) 区分与词汇语意关系知识库。相信词义的区分与表达，必须建立在完善的词汇语意学...

XML

找到17个数据集