数据集

  • 基于cnSchema的《三体》人物关系知识图谱

    1.利用Jieba分词对刘慈欣代表作《三体》进行人物实体抽取,在百度百科的知识链接上通过“https://baike.baidu.com/item/”+词条名 进行人物关系描述爬取,使用深度学习的方法,抽取实体之间的关系,所使用的工具包为kashgari; 2.基于cnSchema的核心classes与properties进行扩展;...
  • 动漫基本信息知识图谱

    本项目构建了近年来热门动漫的相关信息的知识图谱 1.动漫信息爬取自百度百科、豆瓣。爬取的信息包括动漫的中文名、角色设计、类型、主要配音、导演、动画监督、首播电视台等信息并进行清洗。 2.基于D3可视化工具进行可视化,并提供搜索功能。用户可以在搜索框中输入想查询的动漫,网页会给出该动漫的相关信息,并隐藏额外的其他信息。