基于众包标注系统的文言文语言理解测评基准及数据集

C-CLUE是一个基于众包标注系统构建的文言文语言理解测评基准及数据集,由天津大学数据库课题组贡献。本次开源了由系统标注结果获取的近2万个实体以及4千多个关系,并处理分割成为训练集、校验集、测试集等文件, 可供自然语言处理中命名实体识别和关系抽取任务直接使用。该基准及数据集能够为基于史书的历史知识图谱构建提供数据支持,以通过高度关联化数据的方式构造及展现数字人文内容。

数据与资源

其他信息

价值
https://github.com/jizijing/C-CLUE
作者 Xin Wang, Haofen Wang, Zijing Ji, Yuxin Shen, Qingyan Guo, Yang Sun, Guanzhong Liu, Zijun Wang, Yining Sun, Tian Yu
维护者 Zijing Ji
最近更新 十一月 1, 2024, 01:56 (UTC)
创建的 十一月 21, 2021, 13:28 (UTC)