找到212个数据集

授权: Creative Commons Attribution

过滤结果
  • 鬼灭之刃知识图谱

    本项目依据成员的兴趣,构建了动漫《鬼灭之刃》的知识图谱。本图谱的数据来源为Fandom鬼灭之刃wiki和萌娘百科鬼灭之刃的词条。项目构建了以人物、组织、技能为主要实体的知识图谱,实现步骤主要有以下几点: 通过爬虫爬取网页wiki上的半结构化数据和文字数据 对爬取的数据分别进行数据处理,半结构化数据直接转化为三元组,文字数据进行知识抽取...
  • 陈奕迅音乐作品知识图谱

    2022年年末,陈奕迅的歌迷们终于盼来了在香港红馆举行的陈奕迅《FEAR AND DREAMS》演唱会,在此背景下,我们构建了陈奕迅音乐作品知识图谱,以便对陈奕迅演唱的作品进行更加深入的了解和分析。...
  • 安卓API关联关系知识图谱及挖掘分析

    基于安卓API级别14-29官方文档,逐文档提取包、类、方法、权限四类实体 针对结构化文本直接解析关系,针对非结构化文本,采用基于模板匹配的关系抽取:人工提取关系匹配模板,逐句进行自然语言处理中的单词主干提取、实体名称规范化等操作,进行关系匹配,获得函数关系、类关系、继承关系、使用参数、返回值、抛出、替代、条件、指代、使用权限等十类关系...
  • 《红楼梦》人物关系知识图谱

    本项目构建了《红楼梦》中的各人物以及他们之间的人物关系的知识图谱。主要包括四部分工作:(1)数据获取与预处理;(2)命名实体识别;(3)实体关系抽取;(4)可视化与知识问答。
  • 郑渊洁相关

    There is no description for this dataset

  • 希腊神话人物知识图谱

    基于百度百科及其他开放域数据作为语料来源,将神话人物名字作为主题关键词,通过爬虫爬取结构化数据作为知识图谱基本数据,并进行语义抽取构建了希腊神话人物关系的核心数据 在上述基础上,我们对数据进行半结构化,实体消歧(指爬虫的过程中选取希腊神话故事的人物),实体互补(指利用实体的亲属关系值的内容进行实体补充) 利用知识图谱实现了简单的知识问答
  • 浙江省文化站基础信息

    来自于浙江省数据开放平台,并利用ChatGPT对文化站的交通消息进行了格式化与抽取。
  • 基于cnScheme的外国文学研究领域知识图谱

    基于开放域数据CNKI的12833 篇研究文献作为语料来源,将文献中的关键词作为主题关键词,作者作为研究人员。通过爬虫爬取结构化数据作为知识图谱基本数据,结合爬取一些自然语言数据与半结构化数据,并进行语义抽取构建了外国文学研究领域的核心数据 在上述基础上,我们进行了实体对齐与部分的实体消歧,比如译名的对齐:列夫·托尔斯泰 和 托尔斯泰...
  • author_article_school

    从知网下载的4000条左右的论文数据集,总共三个实体 作者(author_id,name) 论文(article_id,summary,urls,year,article_name,cite,down) 就读高校(school_id,school_name) 关系:write_to,graduate_to 可以直接导入Neo4j使用
  • 基于cnSchema的浙江历史人物知识图谱

    原始数据是从浙江省数据开放平台获取,通过构建schema,和数据预处理最终形成了基于cnSchema的浙江历史人物知识图谱。 《浙江历史名人》专题数据库所收浙江人物,除浙江籍的历史名人外,也包括了浙江旅外人士和外地长期在浙江工作并作出突出贡献者。时间跨度,上溯春秋战国,下延20世纪末收入人物3万多人。...
  • 基于cnSchema的浙江公共图书馆知识图谱

    本数据是由“浙江省公共图书馆基本信息”和“浙江省公共图书馆地理信息”整理合并而成。二者的原始数据均是从浙江省数据开放平台获取,统一schema后,对两个数据集进行整理合并,最终形成了基于cnSchema的浙江公共图书馆知识图谱。...
  • 基于cnSchema的浙江定点医疗机构知识图谱

    原始数据是从浙江省数据开放平台获取,通过构建schema和数据预处理等操作最终形成了基于cnSchema的浙江定点医疗机构知识图谱。本数据是浙江省各医院、门诊等定点医疗机构的基本信息。 本数据包含定点医疗机构名称,定点类别,机构编码,服务人群,地址等信息。其中“医疗机构名称”,“地址”等使用了cnSchema中的定义。提供json-...
  • 基于cnSchema的浙江森林公园知识图谱

    原始数据是从浙江省数据开放平台获取,通过构建schema和数据预处理等操作最终形成了基于cnSchema的浙江森林公园知识图谱。本数据是位于浙江省内的国家级、省级等森林公园基本信息。...
  • 基于cnSchema的浙江宗教团体知识图谱

    原始数据是从浙江省数据开放平台获取,通过构建schema、数据预处理等最终形成了基于cnSchema的浙江宗教团体知识图谱。本数据记录了浙江省各地级市中宗教团体/协会的基本信息。...
  • 基于cnSchema的浙江宗教场所知识图谱

    原始数据是从浙江省数据开放平台获取,通过构建schema、数据预处理等最终形成了基于cnSchema的浙江宗教场所知识图谱。本数据记录了浙江省各地级市中宗教场所的基本信息。...
  • 基于cnSchema的浙江A级景区知识图谱

    原始数据是从浙江省数据开放平台获取,通过构建schema、数据预处理等最终形成了基于cnSchema的浙江A级景区知识图谱。本数据记录了浙江省各地的A级景区基本信息。 《浙江省A级景区基本信息》包含了景区名称,等级,地址等信息。其中“景区名称”、“等级”、“地址”等使用了cnSchema中的定义。提供json-ld,ttl,RDF和xml四种下载格式。...
  • 基于cnSchema的浙江旅行社(企业)知识图谱

    原始数据是从浙江省数据开放平台获取,通过构建schema和数据预处理等操作最终形成了基于cnSchema的浙江旅行社(企业)知识图谱。主要是旅行社(企业)的基本信息数据。...
  • 区域供热供冷系统知识图谱

    本开放资源分享的是区域供热供冷系统知识图谱。知识图谱技术能够解决当前区域供热供冷领域亟需解决的知识描述方法和构建数据理解及推理框架两个核心基础理论问题,基于知识图谱技术,一方面可以实现最大程度的知识复用;一方面可以实现复杂智能的知识计算,为大数据分析诊断和运行规律识别提供知识推理支持。
  • GAKG: 地学多模态学术知识图谱

    GAKG 是⼀个⼤型多模态学术知识图谱,Acemap研究团队背靠DDE项目设计了一个新颖的地球科学多模态学术知识图谱GAKG,其中所有的数据均来⾃ AceMap (https://www.acemap.info/ ),希望能为地学领域、数据挖掘和信息检索领域的研究者们提供数据和服务。
  • IREE:投资领域细颗粒度风险事件抽取数据集

    A Dataset for Chinese Event Extraction in Investment Research 更新 20220703 论文已录用 20220604 双盲审稿暂时隐去作者及机构信息 背景介绍 目前,中文数据集主要来源于百度的千言数据集评测LUGE、中文信息学会主办的CCKS、中国计算机学会主办的CCF-...
您也可以使用应用程式界面 (看 API文献)注册.