-
SentiBridge: 实体/属性-情感词表
实体/属性-情感词对定义:实体/属性—情感词 例如:“长城 宏伟”、“性价比 高”、“价格 高” 详细信息请阅读 readme.txt -
CED:篇章目录结构树抽取
目录作为篇章中天然的结构化信息,可以快速定位目标信息所在的片段。本项目旨在提供一系列从篇章中抽取目录结构的数据集和工具。 -
DocEE:篇章事件抽取框架
面向中文篇章事件抽取任务的框架,支持PTPCG、Doc2EDAG、GIT等多种SOTA模型。 -
Mirror:面向各类信息抽取任务的通用框架
针对信息抽取任务繁多,各任务之间无法有效共享知识的问题,我们设计了一种统一的信息抽取框架,从而促进模型对于各任务的能力。该框架不仅支持命名实体识别、关系抽取、事件抽取等传统任务,也支持文本分类、多元抽取、非连续实体抽取、阅读理解等复杂任务。我们还对任务预训练数据进行了消融实验,结果发现分类和阅读理解任务对信息抽取任务有着良好的提升作用。... -
SGSum体育赛事摘要
SGSum(Sports Game Summarization)数据集是一个大规模人工清洗的中文体育赛事摘要数据集。本数据集来源于新浪体育在线(http://match.sports.sina.com.cn/index.html)... -
电商情感词典ECSD
== 电商情感词典 == 本项目介绍苏州大学人类语言研究所构建的电商情感词典,包括通用的情感词条和电商领域特有的情感词条,共计3138条