找到17个数据集

授权: Creative Commons Attribution

过滤结果
  • BTC2019数据集: Billion Triple Challenge 2019 Dataset

    BTC数据集是从2018/12/12到2019/01/11使用LDspider进行大规模RDF爬取的数据,数据以四元组的形式存储,第四个元素编码相关联的三元组从web文档解析的位置。数据集包含了2,155,856,033个四元组,...
  • 基于cnSchema的浙江历史人物知识图谱

    原始数据是从浙江省数据开放平台获取,通过构建schema,和数据预处理最终形成了基于cnSchema的浙江历史人物知识图谱。 《浙江历史名人》专题数据库所收浙江人物,除浙江籍的历史名人外,也包括了浙江旅外人士和外地长期在浙江工作并作出突出贡献者。时间跨度,上溯春秋战国,下延20世纪末收入人物3万多人。...
  • 基于cnSchema的浙江公共图书馆知识图谱

    本数据是由“浙江省公共图书馆基本信息”和“浙江省公共图书馆地理信息”整理合并而成。二者的原始数据均是从浙江省数据开放平台获取,统一schema后,对两个数据集进行整理合并,最终形成了基于cnSchema的浙江公共图书馆知识图谱。...
  • 基于cnSchema的浙江定点医疗机构知识图谱

    原始数据是从浙江省数据开放平台获取,通过构建schema和数据预处理等操作最终形成了基于cnSchema的浙江定点医疗机构知识图谱。本数据是浙江省各医院、门诊等定点医疗机构的基本信息。 本数据包含定点医疗机构名称,定点类别,机构编码,服务人群,地址等信息。其中“医疗机构名称”,“地址”等使用了cnSchema中的定义。提供json-...
  • 基于cnSchema的浙江森林公园知识图谱

    原始数据是从浙江省数据开放平台获取,通过构建schema和数据预处理等操作最终形成了基于cnSchema的浙江森林公园知识图谱。本数据是位于浙江省内的国家级、省级等森林公园基本信息。...
  • 基于cnSchema的浙江宗教团体知识图谱

    原始数据是从浙江省数据开放平台获取,通过构建schema、数据预处理等最终形成了基于cnSchema的浙江宗教团体知识图谱。本数据记录了浙江省各地级市中宗教团体/协会的基本信息。...
  • 基于cnSchema的浙江宗教场所知识图谱

    原始数据是从浙江省数据开放平台获取,通过构建schema、数据预处理等最终形成了基于cnSchema的浙江宗教场所知识图谱。本数据记录了浙江省各地级市中宗教场所的基本信息。...
  • 基于cnSchema的浙江A级景区知识图谱

    原始数据是从浙江省数据开放平台获取,通过构建schema、数据预处理等最终形成了基于cnSchema的浙江A级景区知识图谱。本数据记录了浙江省各地的A级景区基本信息。 《浙江省A级景区基本信息》包含了景区名称,等级,地址等信息。其中“景区名称”、“等级”、“地址”等使用了cnSchema中的定义。提供json-ld,ttl,RDF和xml四种下载格式。...
  • 基于cnSchema的浙江旅行社(企业)知识图谱

    原始数据是从浙江省数据开放平台获取,通过构建schema和数据预处理等操作最终形成了基于cnSchema的浙江旅行社(企业)知识图谱。主要是旅行社(企业)的基本信息数据。...
  • OpenKG 精选文章汇编(2020 年度)

    2020 年我们总共分享了 144 篇文章,其中原创文章 69 篇,内容涵盖了知识 图谱的方方面面,包括开源开放、领域应用、技术动态、论文浅尝、会议研讨等 多个主题。截止目前,公众号总订阅数已达 3.1 万人,全年累计阅读量达 58 万 +,累计阅读人数达 41 万+。 今年的汇编我们分解为“论文浅尝”、“开源开放”和“技术前线” 三个...
  • 新冠开放知识图谱.数据规范-Schema

    这个是此次新冠图谱的数据规范要求,此数据集后续将集中发布各个图谱的Schema文件供大家重用。
  • OpenKG论文浅尝2019年论文汇编

    OpenKG「论文浅尝」旨在通过分享近期知识图谱领域的论文笔记,内容涉及信息抽取、知识推理、知识问答、推荐系统、知识融合等多个方向。2019年共推送 90 篇「论文浅尝」,这本论文汇编是根据文章阅读量挑选出的其中20+篇笔记。 特别感谢:整理「论文浅尝」笔记的来自浙江大学、东南大学、南京大学、天津大学、复旦大学的 40 多位同学。
  • webdatacommons数据集

    越来越多的网站使用结构化的数据来表述一些比如商品、人物、组织、地点、事件或者菜谱等等。这些结构化的数据经常使用诸如RDFa,Microdata或者Microformats等格式存储。Common Crawl是现如今向公众开放的最大网络语料库,里面存有66 TeraByte的网页数据,而Web Data...
  • MIT - ConceptNet5的中文部分-截至2017年1月

    OpenKG收集和整理国内国外重要的开放知识库和知识图谱项目,并组织整理相关的中文资料免费对外开放。 ConceptNet是常识知识库。最早源于MIT媒体实验室的Open Mind Common Sense (OMCS)项目。OMCS项目是由著名人工智能专家Marvin...
  • Deepdive:完善的知识抽取框架

    OpenKG搜集和整理知识图谱相关的技术工具,并将组织开展技术评测。Deepdive是由斯坦福大学InfoLab实验室开发的一个开源知识抽取系统。它通过弱监督学习,从非结构化的文本中抽取结构化的关系数据 ,可以判断两个实体间是否存在指定关系。具有较强的灵活性,可以自己训练模型。
  • 汉语开放词网(Chinese Open WordNet)

    汉语开放词网(Chinese Open WordNet) OpenKG收集和整理国内国外重要的开放知识库和知识图谱项目,并组织整理相关的中文资料免费对外开放。 汉语开放词网是受 Princeton WordNet 和 Global WordNet Grid 启发由 NTU Computational Linguistics Lab...
  • 中文词汇网路(Chinese Wordnet)

    中文词汇网路(Chinese Wordnet) OpenKG收集和整理国内国外重要的开放知识库和知识图谱项目,并组织整理相关的中文资料免费对外开放。 中文词汇网路 (Chinese Wordnet, 以下简称中文词网) 计画,目的是在提供完整的中文词义 (sense) 区分与词汇语意关系知识库。相信词义的区分与表达,必须建立在完善的词汇语意学...