找到8个数据集

过滤结果
  • 数地搜搜:事理驱动的全网实时事件数据库分析引擎

    数地搜搜,事理驱动下的全网实时事件数据库分析引擎,通过挖掘因果原子事件,以全网数千家网页新闻为数据源,经过事件去重、事件聚类、事件提取、事件实体链接等技术,形成以因果事件为核心的大规模实时事件数据库。通过结合数据、融合推理的方式,实现对特定事件的综合分析。
  • 10万中文人物关系图谱数据集

    近十万的人物关系数据,涉及人物71,243个,大类关系102个,小类关系266条。可以支撑包括知识问答、多跳推理、图谱可视化、未知关系推理、数据回标、特征增强、人物推荐、人物建模等多种应用尝试和科学研究工作。
  • 学迹:大规模实时(事件逻辑与概念)事理知识库

    实时事理逻辑知识库终身学习和事件为核心的知识库搜索项目。包括事件概念抽取、事件因果逻辑抽取、事件数据关联推荐与推理。截至目前,我们已经积累事件概念描述三元组500余万,因果事件三元组两千余万,概念上下位三元组一百余万。“学迹”为三元组提供了一个搜索入口,围绕事件,提供事件的前序原因、后续结果,事件的关联概念,事件关联产业链的搜索。
  • 35万中文抽象知识三元组

    高质量的346048条中文抽象知识三元组知识库,来源于公开网络文本抽象三元组挖掘、人工手工整理等多个渠道,覆盖商品、行业、动作、性状、名词性实体等多种类型。可用于查询扩展、句子改写、句子相似度计算、句子推荐等多个应用场景。
  • 43万中文同义知识三元组

    43万中文同义知识三元组,来源于公开数据文本同义词挖掘、词典整理与人工修正等多个渠道,可用于同义词扩展相关应用,如搜索扩展查询、句子相似度计算等。格式为词语1,同义,词语2。
  • 13万中文简称知识三元组

    136081条中文简称知识三元组,涉及高校、商品名称、公司简称等多个领域,来自公开网络文本简称抽取、人工整理等多个渠道,可用于简称抽取评测、实体链接、搜索查询扩展、句子改写等多个场景。格式为:中国经理管理大学,简称,中经大。
  • 全行业因果事理图谱(前因后果)检索知识库

    为了给分析师以及其他行业人员提供领域和常识性的事件推理历史经验库,我们推出了商品金融事理图谱。我们经过事件标准化、事件对齐、事件融合等处理后,最终形成了具有动态更新能力的千万级多行业领域事理图谱。该平台以可视化的方式,对输入的特定事件的原因和结果进行展示,并对社会开放使用。
  • 87万通用领域实体概念描述三元组

    87万实体概念描述知识库,基于开放文本挖掘而成,格式为[实体/概念,描述体,置信度],...