找到59个数据集

机构: OpenKG

过滤结果
  • 基于cnSchema的浙江旅行社(企业)知识图谱

    原始数据是从浙江省数据开放平台获取,通过构建schema和数据预处理等操作最终形成了基于cnSchema的浙江旅行社(企业)知识图谱。主要是旅行社(企业)的基本信息数据。...
  • NeuralKG:浙江大学开源知识图谱表示学习工具

    NeuralKG工具包整体基于PyTorch Lightning框架,提供了用于多种知识图谱表示学习模型的通用工作流程,并且高度模块化。NeuralKG具有如下特性: 支持多种方法。 NeuralKG提供了对三类知识图谱嵌入方法的代码实现,包括传统知识图谱嵌入,基于图神经网络的知识图谱嵌入,以及基于规则的知识图谱嵌入。...
  • OpenKG 精选文章汇编(2020 年度)

    2020 年我们总共分享了 144 篇文章,其中原创文章 69 篇,内容涵盖了知识 图谱的方方面面,包括开源开放、领域应用、技术动态、论文浅尝、会议研讨等 多个主题。截止目前,公众号总订阅数已达 3.1 万人,全年累计阅读量达 58 万 +,累计阅读人数达 41 万+。 今年的汇编我们分解为“论文浅尝”、“开源开放”和“技术前线” 三个...
  • 新冠开放知识图谱.百科

    新冠百科(包括病毒、细菌、流行病、传染病等)。一个领域百科KG,这是基础;从各大百科出发,也会涵盖之前几次疫情涉及到的知识点。 图谱以病毒,细菌为主体,扩展了治疗,疾病相关内容,通过了这些概念的百科知识,形成新冠百科知识图谱。 潜在应用:面向新冠相关术语的语义检索、智能问答,并可用于新冠相关文档的智能搜索和推荐。...
  • 《大词林》开源75万核心实体和围绕核心实体的细粒度概念、关系列表

    开源了《大词林》中的75万的核心实体,和该核心实体对应的细粒度概念词(共1.8万概念词,300万实体-...
  • 新冠开放知识图谱.数据规范-Schema

    这个是此次新冠图谱的数据规范要求,此数据集后续将集中发布各个图谱的Schema文件供大家重用。
  • OpenKG论文浅尝2019年论文汇编

    OpenKG「论文浅尝」旨在通过分享近期知识图谱领域的论文笔记,内容涉及信息抽取、知识推理、知识问答、推荐系统、知识融合等多个方向。2019年共推送 90 篇「论文浅尝」,这本论文汇编是根据文章阅读量挑选出的其中20+篇笔记。 特别感谢:整理「论文浅尝」笔记的来自浙江大学、东南大学、南京大学、天津大学、复旦大学的 40 多位同学。
  • 唐诗别苑--基于知识图谱的全唐诗语义检索与可视化平台

    功能一:语义检索——“没有你找不到的唐诗” 1.查询诗人信息或作品,可输入其名字或别号 2.查询诗人交友状况 3.查询诗歌地点、风格、主题、题材、意象、教学阶段等信息,可输入相关标签或将其组合 功能二:知识图谱可视化——“原来唐诗可以这么玩” 1.动态诗人社交网络:一眼看到谁是社交小王子 2.诗人迁徙游历图:唐代最厉害的驴友是谁?等待你来挖掘...
  • Synonyms:一个开源的中文近义词工具包

    Synonyms是Hai Liang Wang 和胡小夕在 GitHub 开放了一个中文近义词工具包,它可用于如文本对齐、推荐算法、相似度计算、语义偏移、关键字提取、概念提取、自动摘要、搜索引擎等很多 NLP 任务。该工具包目前能搜索近义词和比较语句相似度等任务,且词汇量达到了 125,792。
  • webdatacommons数据集

    越来越多的网站使用结构化的数据来表述一些比如商品、人物、组织、地点、事件或者菜谱等等。这些结构化的数据经常使用诸如RDFa,Microdata或者Microformats等格式存储。Common Crawl是现如今向公众开放的最大网络语料库,里面存有66 TeraByte的网页数据,而Web Data...
  • 国内主要中文百科知识图谱之间的链接数据集

    链接的中文百科知识图谱是OpenKG正在从事的一项工作。目的是促进百科类、通用域的知识图谱的开放与互联。目前已经初步建立了国内几个主要中文开放百科类知识图谱的链接,这包括Zhishi.me(狗尾草科技、东南大学)、CN-DBPedia(复旦大学)、XLore(清华大学)、Belief-...
  • 本体编辑工具TopBraid

    TopBraid Composer™ from TopQuadrant is an enterprise-class platform for developing Semantic Web ontologies and building semantic applications. TopBraid Composer has been...
  • 斯坦福本体构建工具Protege

    Protégé软件是斯坦福大学医学院生物信息研究中心基于Java语言开发的本体编辑和知识获取软件,或者说是本体开发工具,也是基于知识的编辑器,属于开放源代码软件。这个软件主要用于语义网中本体的构建,是语义网中本体构建的核心开发工具,现在的最新版本为5.0.0版本。...
  • MIT - ConceptNet5的中文部分-截至2017年1月

    OpenKG收集和整理国内国外重要的开放知识库和知识图谱项目,并组织整理相关的中文资料免费对外开放。 ConceptNet是常识知识库。最早源于MIT媒体实验室的Open Mind Common Sense (OMCS)项目。OMCS项目是由著名人工智能专家Marvin...
  • YodaQA-开源QA工具

    YodaQA is an open source Factoid Question Answering system that can produce answer both from databases and text corpora using on-the-fly information extraction. By default, open...
  • Stanford CoreNLP: A Java suite of core NLP tools

    Stanford CoreNLP是由斯坦福大学自然语言处理组开发的一套自然语言处理工具包,包括分词、词性标注、命名实体识别、句法分析、指代消解、情感分析等模块,主要面向英文自然语言处理。同时很多功能对其他语言同样有支持,例如中文的分词、词性标注、句法分析等。该项目遵从GPL协议。
  • FudanNLP: 中文自然语言处理工具包

    FudanNLP是由复旦大学自然语言处理组开发的一套中文自然语言处理工具包,包括中文分词、词性标注、命名实体识别、依存句法分析、关键词抽取、时间短语识别、文本分类、新闻聚类、层次分类、在线学习等功能,该项目使用LGPL3.0许可证。
  • HanLP: Han Language Processing

    HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 HanLP提供下列功能:分词、词性标注、命名实体识别、关键词抽取、自动摘要、短语提取、拼音转换、简繁转换、文本推荐、依存句法分析等。
  • 哈工大LTP: Language Technology Platform

    语言技术平台(Language Technology Platform,LTP)是哈工大社会计算与信息检索研究中心历时十年开发的一整套开源中文语言处理系统。包括分词、词性标注、命名实体识别、依存句法分析、语义角色标注等功能。
  • scikit-kge: MIT知识图谱embedding工具包

    此工具包是有麻省理工大学( MIT )开发的python库,可用不同方法训练得到知识图谱的分布式表示结果,包含的知识图谱表示学习方法有: Holographic Embeddings (HolE) RESCAL TransE TransR ER-MLP