- 
    
      
CED:篇章目录结构树抽取
目录作为篇章中天然的结构化信息,可以快速定位目标信息所在的片段。本项目旨在提供一系列从篇章中抽取目录结构的数据集和工具。 - 
    
      
基于知识图谱的多模态类比推理数据集
ICLR2023“Multimodal Analogical Reasoning over Knowledge Graph”提出的数据集,包含一个多模态知识图谱数据集MarKG和一个多模态类比推理数据集MARS,用来评估模型的多模态类比推理能力。 - 
    
      
人物百科知识图谱
该知人物识图谱以百度百科为基础数据集自顶向下构建而成,抽取分析其中的人物部分,总共包含人物实体2,480,097个,数据包含原始页面,图谱三元组(包括人物属性和人物关系)以及本体。数据可以辅助人物相关应用、问答系统等,目前第一版只考虑了利用了文本部分数据,后续会进行多模态数据的更新。 - 
    
      
红楼梦人物关系
There is no description for this dataset
 - 
    
      
87万通用领域实体概念描述三元组
87万实体概念描述知识库,基于开放文本挖掘而成,格式为[实体/概念,描述体,置信度],...