中文医疗段落检索数据集KUAKE-IR

受疫情催化影响,人们通过互联网获取医疗信息的诉求相比往年更加强烈,搜索质量的高低将直接影响用户获取信息的有效性。因此在AI时代,如何通过构建智能搜索能力提升线上用户的满意度成为了众多医疗AI厂商的重要研究课题。本数据集由阿里巴巴搜索事业部和阿里夸克平台联合发布,目标是旨在推动医疗搜索领域的技术发展。

本数据集包含100W语料库,训练集、验证集和测试集的数量分别为10W、1K和1K。

数据与资源

其他信息

价值
https://tianchi.aliyun.com/dataset/dataDetail?dataId=95414
作者 阿里云天池
维护者 阿里云天池
最近更新 十月 9, 2022, 02:57 (UTC)
创建的 十月 9, 2022, 02:57 (UTC)