Yidu-N7K:医渡云标准化7K数据集

【使用说明】

1、本数据集是根据真实的病历分布由医渡云医学人工编辑而成;

2、本数据集只可以用于自然语言处理的学术科研,不可用于商业目的。

————————————————

Yidu-N4K 数据集源自CHIP 2019 评测任务一,即“临床术语标准化任务”的数据集。

临床术语标准化任务是医学统计中不可或缺的一项任务。临床上,关于同一种诊断、手术、药品、检查、化验、症状等往往会有成百上千种不同的写法。标准化(归一)要解决的问题就是为临床上各种不同说法找到对应的标准说法。有了术语标准化的基础,研究人员才可对电子病历进行后续的统计分析。本质上,临床术语标准化任务也是语义相似度匹配任务的一种。但是由于原词表述方式过于多样,单一的匹配模型很难获得很好的效果。

数据与资源

其他信息

价值
作者 医渡云
维护者 焦增涛
版本 1.0
最近更新 十一月 9, 2020, 02:57 (UTC)
创建的 十一月 9, 2020, 02:57 (UTC)
官方网站 https://www.yiducloud.com.cn