-
基于众包标注系统的文言文语言理解测评基准及数据集
C-CLUE是一个基于众包标注系统构建的文言文语言理解测评基准及数据集,由天津大学数据库课题组贡献。本次开源了由系统标注结果获取的近2万个实体以及4千多个关系,并处理分割成为训练集、校验集、测试集等文件,... -
Yidu-S4K:医渡云结构化4K数据集
【使用说明】 1、本数据集是根据真实的病历分布由医渡云医学人工编辑而成; 2、本数据集只可以用于自然语言处理的学术科研,不可用于商业目的。 ———————————————— Yidu-S4K 数据集源自CCKS 2019 评测任务一,即“面向中文电子病历的命名实体识别”的数据集,包括两个子任务:... -
TechKG_Applications
TechKG_Applications是由“东北大学-...