数据集

  • Zhishi.me

    Zhishi.me 通过从开放的百科数据中抽取结构化数据,首次尝试构建中文通用知识图谱。目前,已融合了三大中文百科,百度百科,互动百科以及维基百科中的数据。 我们提供了一个 SPARQL 终端 供用户查询,目前查询返回的结果通过HTML的形式给出。 更多有关Zhishi.me的信息可以访问ISWC2011的论文。
  • 病人事件图谱数据集

    病人事件图谱是一种新的基于RDF的医疗观察性数据表示模型,可以清晰地表示临床检查、诊断、治疗等多种事件类型以及事件的时序关系。使用三家上海三甲医院的电子病历数据,构建了包括3个专科、173395个医疗事件、501335个事件时序关系以及与5313个知识库概念链接的医疗数据集。
  • 中文症状库

    这是一个包含症状实体和症状相关三元组的数据集。中文症状库的数据来自8个主流的健康咨询网站、3个中文百科网站和电子病历。它还包含了中文症状与UMLS中概念的链接结果。我们为该数据集提供了关键词查询和SPARQL查询功能(http://dsc.nlp-bigdatalab.org:8081/search.html)。
  • Zhishi.lemon

    Zhishi.lemon 是在Zhishi.me数据集的基础上,利用lemon语言模型以及其扩展的翻译模块构建的多语言知识图谱。目前已包含了中文,西班牙文以及英文间的sameAs关系,同时也与目前最大的多语言知识库BabelNet进行了关联。 我们提供了一个 SPARQL 终端 供用户查询。ISWC 2016的论文中对该数据集有更为详细的描述。