-
国内外TOP250电影作品知识图谱
我们基于国内外优秀影视作品,构建了一个关于其类型、主演、导演、上映时间的知识图谱。本项目运用了数据爬虫技术、深度抽取技术、知识图谱构建技术等关键技术,并在图谱上进一步实现了搜索、问答、挖掘等简单的应用。 -
哈利·波特系列人物知识图谱
哈利·波特的人物属性及关系信息知识图谱 我们利用爬虫在哈利·波特中文wiki网站爬取了所有人物的相关属性及人物间关系的信息,人物属性包括出生、职业、从属的组织等,并尝试利用深度抽取技术从书中抽取人物关系。我们将数据存储在neo4j数据库中,将人物、组织、学院等作为图谱中的节点,针对图数据做了相关的数据分析,并利用其支持了一些简单的知识问答操作。 -
影视实体/关系抽取、短评质量检测
我们爬取了豆瓣电影短评和电影的信息,使用ALBERT抽取评论和电影介绍中的实体,并且利用PXIELCNN抽取实体关系,并且利用抽取的特征和电影、短评的文本特征,建立模型进行电影和短评的相关度、短评质量判别。我们所有的代码开源在:https://github.com/yongruihuang/Homework-zju-cs/tree/master/KG