Yidu-S4K:医渡云结构化4K数据集

【使用说明】

1、本数据集是根据真实的病历分布由医渡云医学人工编辑而成;

2、本数据集只可以用于自然语言处理的学术科研,不可用于商业目的。

————————————————

Yidu-S4K 数据集源自CCKS 2019 评测任务一,即“面向中文电子病历的命名实体识别”的数据集,包括两个子任务:

1)医疗命名实体识别:由于国内没有公开可获得的面向中文电子病历医疗实体识别数据集,本年度保留了医疗命名实体识别任务,对2017年度数据集做了修订,并随任务一同发布。本子任务的数据集包括训练集和测试集。

2)医疗实体及属性抽取(跨院迁移):在医疗实体识别的基础上,对预定义实体属性进行抽取。本任务为迁移学习任务,即在只提供目标场景少量标注数据的情况下,通过其他场景的标注数据及非标注数据进行目标场景的识别任务。本子任务的数据集包括训练集(非目标场景和目标场景的标注数据、各个场景的非标注数据)和测试集(目标场景的标注数据)。

数据与资源

其他信息

价值
作者 医渡云
维护者 焦增涛
版本 1.1
最近更新 十一月 9, 2020, 03:55 (UTC)
创建的 十一月 9, 2020, 03:55 (UTC)
官方网站 https://www.yiducloud.com.cn