找到5个数据集

格式: TXT

过滤结果
  • 35万中文抽象知识三元组

    高质量的346048条中文抽象知识三元组知识库,来源于公开网络文本抽象三元组挖掘、人工手工整理等多个渠道,覆盖商品、行业、动作、性状、名词性实体等多种类型。可用于查询扩展、句子改写、句子相似度计算、句子推荐等多个应用场景。
  • 43万中文同义知识三元组

    43万中文同义知识三元组,来源于公开数据文本同义词挖掘、词典整理与人工修正等多个渠道,可用于同义词扩展相关应用,如搜索扩展查询、句子相似度计算等。格式为词语1,同义,词语2。
  • 87万通用领域实体概念描述三元组

    87万实体概念描述知识库,基于开放文本挖掘而成,格式为[实体/概念,描述体,置信度],...
  • 华人家谱关联数据集

    家谱,又称谱牒、族谱、宗谱、家乘、世谱等,是同宗共祖的血亲团体记载本族世系和相关事迹、反映本家族繁衍发展过程的历史图籍。它与正史、方志、构成了中华民族历史大厦的三大支柱,在中国乃至世界文明的文明发展历史上,堪称弥足珍贵的文化遗产。
  • 常识因果关系网络(英文)

    从Bing网页快照(英文)数据中利用pattern提取可能的因果关系对。词对中的单词均包含在WordNet 3.0 中的名词、动词、形容词和副词中。数据集的抽取和相关应用可以参考文章:Commonsense Causal Reasoning between Short Texts...