找到13个数据集

授权: Creative Commons Non-Commercial (Any)

过滤结果
  • 医疗清单发票OCR要素提取CMedOCR

    本数据集来源于CHIP2022医疗因果实体关系抽取学术评测任务:http://cips-chip.org.cn/2022/eval4 , 包括1,000条训练数据,700条测试数据。本数据集由北京环球医疗救援提供。
  • 中文医疗段落检索数据集KUAKE-IR

    受疫情催化影响,人们通过互联网获取医疗信息的诉求相比往年更加强烈,搜索质量的高低将直接影响用户获取信息的有效性。因此在AI时代,如何通过构建智能搜索能力提升线上用户的满意度成为了众多医疗AI厂商的重要研究课题。本数据集由阿里巴巴搜索事业部和阿里夸克平台联合发布,目标是旨在推动医疗搜索领域的技术发展。...
  • 医疗因果实体关系抽取数据集CMedCausal

    本数据集来源于CHIP2022医疗因果实体关系抽取学术评测任务:http://cips-chip.org.cn/2022/eval2 , 包括2,000段训练数据,2,000段测试数据。本数据集由阿里巴巴夸克医疗事业部和阿里云天池联合提供。
  • 医疗对话临床发现阴阳性判别数据集MDCFNPC

    本数据集来源于CHIP2021医疗对话临床发现阴阳性判别学术评测任务:http://cips-chip.org.cn/2021/eval1 , 数据集包括6,000段训练数据,4,000段测试数据。 本数据集由阿里夸克医疗事业部和阿里云天池平台联合提供。
  • 新冠疫情相似句对判定数据集

    新冠疫情相似句对判定数据集来自天池大赛:https://tianchi.aliyun.com/competition/entrance/231776/information
  • 中药说明书实体识别数据集TCM-NER

    本数据集来源于天池中医药实体识别大赛:https://tianchi.aliyun.com/competition/entrance/531824/information。 数据来自中药药品说明书,通过挖掘中药说明书构建中药合理用药的知识图谱,将为中医规范诊疗奠定较好基础。抽取中药药品说明书中的关键信息可以帮助扩充中医药药品知识库。
  • 中医文献问题生成数据集TCM-QG

    本数据集来自天池中医药问题生成大赛:https://tianchi.aliyun.com/competition/entrance/531826/information 。中医文献问题生成数据集包含3500篇语料,每篇文档由人工标注产生1~4对(问题, 答案)对。
  • 中文糖尿病科研文献实体关系数据集DiaKG

    瑞金糖尿病知识图谱数据集,来源天池比赛:https://tianchi.aliyun.com/competition/entrance/231687/introduction
  • 面向家庭常见疾病的知识图谱

    面向家庭常见疾病的知识图谱涵盖了常见医疗相关信息,包括常见疾病、症状、治疗手段、常用药物、推荐食谱等方面的内容。在目前新冠疫情流行的大环境下,以医疗知识图谱为基础的问答系统旨在让大众足不出户即可对疾病的进行初步判断、用药以改善病情。
  • mdo_dataset

    以常见的医学文档——医学指南文献和药物说明书文档中的医药信息为基础,用细粒度知识表示方式将这两部分知识全面完整、细粒和可循证表示。同时针对模型内容给出三个方面的推理规则并举例,最后使用IAA标准对模型进行检测,结果表明该模型能融合、一致和可循证地表示医药学知识。
  • Yidu-S4K:医渡云结构化4K数据集

    【使用说明】 1、本数据集是根据真实的病历分布由医渡云医学人工编辑而成; 2、本数据集只可以用于自然语言处理的学术科研,不可用于商业目的。 ———————————————— Yidu-S4K 数据集源自CCKS 2019 评测任务一,即“面向中文电子病历的命名实体识别”的数据集,包括两个子任务:...
  • Yidu-N7K:医渡云标准化7K数据集

    【使用说明】 1、本数据集是根据真实的病历分布由医渡云医学人工编辑而成; 2、本数据集只可以用于自然语言处理的学术科研,不可用于商业目的。 ———————————————— Yidu-N4K 数据集源自CHIP 2019 评测任务一,即“临床术语标准化任务”的数据集。...
  • 病人事件图谱数据集

    病人事件图谱是一种新的基于RDF的医疗观察性数据表示模型,可以清晰地表示临床检查、诊断、治疗等多种事件类型以及事件的时序关系。使用三家上海三甲医院的电子病历数据,构建了包括3个专科、173395个医疗事件、501335个事件时序关系以及与5313个知识库概念链接的医疗数据集。