Mirror:面向各类信息抽取任务的通用框架

针对信息抽取任务繁多,各任务之间无法有效共享知识的问题,我们设计了一种统一的信息抽取框架,从而促进模型对于各任务的能力。该框架不仅支持命名实体识别、关系抽取、事件抽取等传统任务,也支持文本分类、多元抽取、非连续实体抽取、阅读理解等复杂任务。我们还对任务预训练数据进行了消融实验,结果发现分类和阅读理解任务对信息抽取任务有着良好的提升作用。

基于此框架,我们开发了一套通用的工具,从而方便用户快速完成各类信息的抽取。我们在此公开通用信息抽取工具Mirror的代码和预训练数据。该工具支持多种信息抽取任务,涵盖文本分类、命名实体识别、实体关系抽取、阅读理解、事件抽取。

数据与资源

其他信息

价值
https://github.com/Spico197/Mirror
作者 朱桐、陈文亮、王昊奋
维护者 朱桐
最近更新 三月 9, 2024, 10:19 (UTC)
创建的 三月 9, 2024, 10:19 (UTC)