-
RJUA-QADatasets: 蚂蚁-仁济泌尿专科QA数据集
数据集概况 本数据集为基于医疗泌尿专科知识构造的QA推理数据集,由蚂蚁集团医疗大模型团队(AntGroup Medical LLM)与上海交通大学医学院附属仁济医院泌尿科(Department of Urology, Shanghai Jiao Tong University School of Medicine Affiliated Renji... -
传染病-抗生素推理与决策支持知识图谱IASO
IASO知识图谱基于DO,IDO,NCBI,HPO和DrugBank等数据库,以及在线百科,权威医学文献等高质量医学数据资源构建而成的。... -
基于cnSchema的浙江定点医疗机构知识图谱
原始数据是从浙江省数据开放平台获取,通过构建schema和数据预处理等操作最终形成了基于cnSchema的浙江定点医疗机构知识图谱。本数据是浙江省各医院、门诊等定点医疗机构的基本信息。 本数据包含定点医疗机构名称,定点类别,机构编码,服务人群,地址等信息。其中“医疗机构名称”,“地址”等使用了cnSchema中的定义。提供json-... -
医疗清单发票OCR要素提取CMedOCR
本数据集来源于CHIP2022医疗因果实体关系抽取学术评测任务:http://cips-chip.org.cn/2022/eval4 , 包括1,000条训练数据,700条测试数据。本数据集由北京环球医疗救援提供。 -
中文医疗段落检索数据集KUAKE-IR
受疫情催化影响,人们通过互联网获取医疗信息的诉求相比往年更加强烈,搜索质量的高低将直接影响用户获取信息的有效性。因此在AI时代,如何通过构建智能搜索能力提升线上用户的满意度成为了众多医疗AI厂商的重要研究课题。本数据集由阿里巴巴搜索事业部和阿里夸克平台联合发布,目标是旨在推动医疗搜索领域的技术发展。... -
医疗因果实体关系抽取数据集CMedCausal
本数据集来源于CHIP2022医疗因果实体关系抽取学术评测任务:http://cips-chip.org.cn/2022/eval2 , 包括2,000段训练数据,2,000段测试数据。本数据集由阿里巴巴夸克医疗事业部和阿里云天池联合提供。 -
医疗对话临床发现阴阳性判别数据集MDCFNPC
本数据集来源于CHIP2021医疗对话临床发现阴阳性判别学术评测任务:http://cips-chip.org.cn/2021/eval1 , 数据集包括6,000段训练数据,4,000段测试数据。 本数据集由阿里夸克医疗事业部和阿里云天池平台联合提供。 -
新冠疫情相似句对判定数据集
新冠疫情相似句对判定数据集来自天池大赛:https://tianchi.aliyun.com/competition/entrance/231776/information -
中药说明书实体识别数据集TCM-NER
本数据集来源于天池中医药实体识别大赛:https://tianchi.aliyun.com/competition/entrance/531824/information。 数据来自中药药品说明书,通过挖掘中药说明书构建中药合理用药的知识图谱,将为中医规范诊疗奠定较好基础。抽取中药药品说明书中的关键信息可以帮助扩充中医药药品知识库。 -
中医文献问题生成数据集TCM-QG
本数据集来自天池中医药问题生成大赛:https://tianchi.aliyun.com/competition/entrance/531826/information 。中医文献问题生成数据集包含3500篇语料,每篇文档由人工标注产生1~4对(问题, 答案)对。 -
中文糖尿病科研文献实体关系数据集DiaKG
瑞金糖尿病知识图谱数据集,来源天池比赛:https://tianchi.aliyun.com/competition/entrance/231687/introduction -
面向家庭常见疾病的知识图谱
面向家庭常见疾病的知识图谱涵盖了常见医疗相关信息,包括常见疾病、症状、治疗手段、常用药物、推荐食谱等方面的内容。在目前新冠疫情流行的大环境下,以医疗知识图谱为基础的问答系统旨在让大众足不出户即可对疾病的进行初步判断、用药以改善病情。 -
DiaKG: 糖尿病知识图谱数据集
【使用说明】 1、本数据集来源于公开发表的41篇糖尿病指南和共识,涵盖了近年来最广泛的研究内容和热点领域,是构建糖尿病知识库的权威资源; 2、本数据集只可以用于自然语言处理的学术科研,不可用于商业目的。... -
医疗问答知识图谱
本项目构建了基于neo4j数据库管理系统的大规模医疗知识图谱,并且提供了图形界面供用户进行问答对话 -
Yidu-S4K:医渡云结构化4K数据集
【使用说明】 1、本数据集是根据真实的病历分布由医渡云医学人工编辑而成; 2、本数据集只可以用于自然语言处理的学术科研,不可用于商业目的。 ———————————————— Yidu-S4K 数据集源自CCKS 2019 评测任务一,即“面向中文电子病历的命名实体识别”的数据集,包括两个子任务:... -
Yidu-N7K:医渡云标准化7K数据集
【使用说明】 1、本数据集是根据真实的病历分布由医渡云医学人工编辑而成; 2、本数据集只可以用于自然语言处理的学术科研,不可用于商业目的。 ———————————————— Yidu-N4K 数据集源自CHIP 2019 评测任务一,即“临床术语标准化任务”的数据集。... -
OMAHA汇知医学知识图谱样例数据
开放医疗与健康联盟(Open Medical and Healthcare Alliance,OMAHA)构建的医学知识图谱样例数据,目前已包括药品适应证和临床路径知识图谱。 完整数据包访问入口链接 -
医疗知识图谱数据(ownthink)
知识图谱可视化检索:https://www.ownthink.com/knowledge.html 知识图谱数据使用方式见主页:https://www.ownthink.com/ 说明文档:https://www.ownthink.com/docs/kg/... -
OMAHA七巧板医学术语集样例数据
开放医疗与健康联盟(Open Medical and Healthcare Alliance,OMAHA)基于本体论构建了一套中文临床医学术语集。涉及领域包括疾病诊断、症状、检验检查、基因、基因突变等,术语集包括概念、术语、关系(子类关系和属性关系)和映射四大核心构件。目前已积累76万概念,100万术语,254万关系。... -
观测指标标识符逻辑命名与编码系统
观测指标标识符逻辑命名与编码系统(Logical Observation Identifiers Names and...