-
民航客服本体
在民航客服服务的领域中,海量的网络信息高效采集难,繁杂的异构数据统一难,信息分析功能不完善,无法高质量满足企业情报决策的要求等。我们构建民航客服服务本体cacso,有助于解决异构数据规范化问题,获取发现隐性知识,提高情报分析质效,实现信息共享,为民航民机客服体系建设发展及企业情报工作人员提供更优质的情报服务。... -
装备知识图谱
本知识图谱研究的是装备知识,包含各类型装备、武器、兵器,装备数据的有效组织与存储,是构建智能化装备知识系统的重要基石。大量的装备属性、装备间关系等数据具有重要的研究与应用价值,然而由于缺少有效的数据组织与存储结构,在面对海量、分散的装备数据时,相关人员难以快速准确地获取装备信息,因此促使我们开展装备知识图谱构建的研究。 -
医疗清单发票OCR要素提取CMedOCR
本数据集来源于CHIP2022医疗因果实体关系抽取学术评测任务:http://cips-chip.org.cn/2022/eval4 , 包括1,000条训练数据,700条测试数据。本数据集由北京环球医疗救援提供。 -
中文医疗段落检索数据集KUAKE-IR
受疫情催化影响,人们通过互联网获取医疗信息的诉求相比往年更加强烈,搜索质量的高低将直接影响用户获取信息的有效性。因此在AI时代,如何通过构建智能搜索能力提升线上用户的满意度成为了众多医疗AI厂商的重要研究课题。本数据集由阿里巴巴搜索事业部和阿里夸克平台联合发布,目标是旨在推动医疗搜索领域的技术发展。... -
医疗因果实体关系抽取数据集CMedCausal
本数据集来源于CHIP2022医疗因果实体关系抽取学术评测任务:http://cips-chip.org.cn/2022/eval2 , 包括2,000段训练数据,2,000段测试数据。本数据集由阿里巴巴夸克医疗事业部和阿里云天池联合提供。 -
医疗对话临床发现阴阳性判别数据集MDCFNPC
本数据集来源于CHIP2021医疗对话临床发现阴阳性判别学术评测任务:http://cips-chip.org.cn/2021/eval1 , 数据集包括6,000段训练数据,4,000段测试数据。 本数据集由阿里夸克医疗事业部和阿里云天池平台联合提供。 -
新冠疫情相似句对判定数据集
新冠疫情相似句对判定数据集来自天池大赛:https://tianchi.aliyun.com/competition/entrance/231776/information -
中药说明书实体识别数据集TCM-NER
本数据集来源于天池中医药实体识别大赛:https://tianchi.aliyun.com/competition/entrance/531824/information。 数据来自中药药品说明书,通过挖掘中药说明书构建中药合理用药的知识图谱,将为中医规范诊疗奠定较好基础。抽取中药药品说明书中的关键信息可以帮助扩充中医药药品知识库。 -
中医文献问题生成数据集TCM-QG
本数据集来自天池中医药问题生成大赛:https://tianchi.aliyun.com/competition/entrance/531826/information 。中医文献问题生成数据集包含3500篇语料,每篇文档由人工标注产生1~4对(问题, 答案)对。 -
中文糖尿病科研文献实体关系数据集DiaKG
瑞金糖尿病知识图谱数据集,来源天池比赛:https://tianchi.aliyun.com/competition/entrance/231687/introduction -
面向家庭常见疾病的知识图谱
面向家庭常见疾病的知识图谱涵盖了常见医疗相关信息,包括常见疾病、症状、治疗手段、常用药物、推荐食谱等方面的内容。在目前新冠疫情流行的大环境下,以医疗知识图谱为基础的问答系统旨在让大众足不出户即可对疾病的进行初步判断、用药以改善病情。 -
MulType
MulType is a knowledge base describing the types of instances from multilingual Wikipedia. MulType is built by a language-independent approach, which can be used in any... -
KG-Buddhism
KG-Buddhism is an effort to build Chinese knowledge graph on Buddhism. It is collected from Zhishi.me and completed by property value pairs extracted from online unstructured... -
Linked Open Schema
Linked Open Schema is an effort to build web-scale schemata from popular sites, which include existing categories with hierarchies and tag clouds. This project is maintained by... -
mdo_dataset
以常见的医学文档——医学指南文献和药物说明书文档中的医药信息为基础,用细粒度知识表示方式将这两部分知识全面完整、细粒和可循证表示。同时针对模型内容给出三个方面的推理规则并举例,最后使用IAA标准对模型进行检测,结果表明该模型能融合、一致和可循证地表示医药学知识。 -
任天堂Switch游戏知识图谱
任天堂Switch(英语:Nintendo Switch,简称NS或Switch)是日本任天堂公司出品的电子游戏机。 本知识图谱包含任天堂Switch自发售以来登陆的所有游戏,与相关厂商、人物之间的关系,方便根据厂商或人物查询感兴趣的游戏。 数据来自中文维基百科。 -
FR2KG:大规模金融研报知识图谱
大规模金融研报知识图谱数据集FR2KG 知识图谱模式包含10个实体类型,19个关系类型和6种属性 知识图谱包含17,799实体,26,798关系三元组,1,328属性三元组 引用 Wang, W.G., et al.: Data set and evaluation of automated construction of financial... -
春秋战国知识图谱(人工构建)
春秋战国历史一直被广大历史爱好者津津乐道。本人出于爱好,构建了春秋战国知识图谱,包含该历史期间出现的人物、人物之间的复杂关系和喜闻乐见的历史事件信息,希望能够给广大历史爱好者带来知识的梳理。同时,知识图谱技术人员,也可以基于该知识图谱构建问答或者可视化分析工具,提供给历史爱好者进行分析与研究。 纯手工制作,图谱质量有保障 -
Yidu-S4K:医渡云结构化4K数据集
【使用说明】 1、本数据集是根据真实的病历分布由医渡云医学人工编辑而成; 2、本数据集只可以用于自然语言处理的学术科研,不可用于商业目的。 ———————————————— Yidu-S4K 数据集源自CCKS 2019 评测任务一,即“面向中文电子病历的命名实体识别”的数据集,包括两个子任务:... -
Yidu-N7K:医渡云标准化7K数据集
【使用说明】 1、本数据集是根据真实的病历分布由医渡云医学人工编辑而成; 2、本数据集只可以用于自然语言处理的学术科研,不可用于商业目的。 ———————————————— Yidu-N4K 数据集源自CHIP 2019 评测任务一,即“临床术语标准化任务”的数据集。...