找到69个数据集

机构: 个人

过滤结果
  • ChatKBQA: 基于微调开源大模型的知识图谱问答工具

    在大语言模型(LLMs)的时代,我们引入了ChatKBQA,这是首个基于对开源LLMs(如Llama-2、ChatGLM2和Baichuan2)进行微调生成图数据库查询(如SPARQL)的知识图谱问答框架。...
  • DuEE1.0中文事件抽取数据集

    DuEE1.0是百度发布的中文事件抽取数据集,包含65个事件类型的1.7万个具有事件信息的句子(2万个事件)。事件类型根据百度风云榜的热点榜单选取确定,具有较强的代表性。...
  • 甄嬛传人物关系数据集

    《甄嬛传》距今已开播十二年,是什么使它火了十二年呢?是因为每个角色人物都塑造得淋漓尽致,从主人公甄嬛,她从一个纯真的少女变成深宫腹黑赢家钮祜禄氏甄嬛;细节到太监小允子,从一开始不受宠嫔妃身边的小太监一路升职打怪成功成为太后身边的首领太监。无论用这部剧中哪个角色的视角方式打开都是一部精彩绝伦的清朝宫廷剧。...
  • Lord of the mysteries

    《诡秘之主》是阅文集团白金作家爱潜水的乌贼所著的西方玄幻类小说,融汇了克苏鲁风格、西方魔幻元素、第一次工业革命时代风情和蒸汽朋克情怀。这是一个蒸汽与机械的世界,这是一段“愚者”的传说。 该作品曾获得第四届橙瓜网络文学奖年度十大作品,最具潜力十大游戏IP。 2021年9月16日,《诡秘之主》被列入“中国网络文学影响力榜:海外影响力榜”。...
  • 林俊杰歌曲知识图谱

    林俊杰(JJ Lin),1981年3⽉27⽇出⽣于新加坡,祖籍中国福建省厦⻔市同安区,华语流⾏乐男歌⼿、⾳乐⼈、潮牌主理⼈。 我们创建了⼀个详细的林俊杰歌曲关系的知识图谱项⽬。这个知识图谱以图形形式展示了林俊杰作为主要实体的节点,并将他的歌曲作为与之相关的⼦节点链接起来。每个节点包含了歌曲的名称、发⾏时间、所属专辑以及与其他实体之间的关系。
  • 《盗墓笔记》知识图谱及问答系统的构建

    《盗墓笔记》是⼀部极具影响⼒的⼩说系列,其丰富的故事情节和独特的世界观吸引了⼤量读者和粉丝。为了更好地理解⼩说中的⼈物、事件和情节,构建⼀个《盗墓笔记》的知识图谱是⼗分必要和有意义的。通过知识图谱技术,可以将⼩说中的关键信息以结构化的⽅式呈现出来,为读者提供更深⼊、更全⾯的阅读体验,同时也为相关研究和探索提供了便利。
  • 使用Lean 4 的Mathlib 库的数学知识图谱

    Lean 4 是一种计算机辅助证明系统(proofassistant),或称交互式证明系统 (in teractive theorem prover),可用于形式化验证数学定理或计算机程序的正确性。 Mathlib 是 Lean 4 的数学库,它背后有一个活跃的开发团队,包括许多数学家...
  • Fights Break Firmament《斗破苍穹》知识图谱

    基于《斗破苍穹》小说构建的人物、势力、异火知识图谱
  • 水稻表型知识图谱及其可视化系统的构建与实现

    中国是世界上水稻产量最大、消费最多的国家,水稻的培育及研究是中国粮食安全战略的重要内容。水稻表型组学研究是植物生物学的研究热点,水稻表型数据的高通量、高维、海量的数据特征对数据的快速检索和知识的有效提取提出了更高的技术要求。 本项目,我们构建了一个水稻表型知识图谱。我们来自国家水稻数据中心(http://www.ricedata.cn)...
  • 三体 (San Ti) - Characters and Plot

    The following ontology was created as final project of the Knowledge Graphs course of the Zhejiang University. It contains the characters of the Trisolaris trilogy of Liu Cixin,...
  • 浙江大学校史人物关系数据库

    浙江大学在长期的办学过程中,以严谨的“求是精神”作为学风培养了大批优秀...
  • GuwenEE:细粒度古汉语事件抽取数据集

    面向古汉语领域事件抽取的数据集,原始数据是从《二十四史》中按篇随机选取而来,包含语料950条,事件Schema72个,包含事件1826个。
  • 百科知识图谱具有100W_en的实体

    处理了同义词,添加了唯一性标签,基于neo4j导出的csv,不要使用office打开,会乱码的,使用程序提取更好一些。 链接:https://pan.baidu.com/s/1LhZ7YUKsHVhsfJIXZB9GhA?pwd=9m15 提取码:9m15
  • 中文多模态命名实体识别数据集

    Wukong-CMNER,一个多模态NER数据集包含图像和文本的语料库。有55423个注释我们语料库中的图像-文本对。本数据是由华为发布的Wukong数据集标注得到,感谢华为公司允许对数据进行标注。
  • 2022卡塔尔世界杯知识图谱

    本项目计划构建2022卡塔尔世界杯中的各种实体(包括球员、国家队、俱乐部等)以及它们之间关系(包括人物与组织概念之间的从属关系以及人物关系等)的知识图谱。
  • 《海贼王》知识图谱

    本项目构建了动画《海贼王》知识图谱,以人物、职业、组织、种族为主要实体,并包含人物间关系,数据来源为Fandom海贼王中文版wiki和百度百科。项目步骤为:数据爬取与预处理,数据清洗和补充,人物关系知识抽取,可视化与知识问答。
  • 名侦探柯南知识图谱及其问答

    这是一个包含名侦探柯南中重要人物之间关系的知识图谱,其中包含有基础的知识图谱问答代码。 百度百科中对《名侦探柯南》系列相关人物和作品都有较为详尽的词条描述,本项目的知识主要来自于此网站。我们通过爬取百科词条,对所需知识内容进行提取。我们选用 neo4j 图数据库来存储我们的名侦探柯南人物关系知识图谱。...
  • 发债主体失信被执行信息

    整理了主要发债主体的失信被执行信息
  • 《倚天屠龙记》人物关系知识图谱

    一个基于金庸武侠小说《倚天屠龙记》的人物关系三元组,包含了文中所有人物之间的主要关系,支持数据可视化。