命名实体识别-测试集-文本文件
Dataset description:
C-CLUE是一个基于众包标注系统构建的文言文语言理解测评基准及数据集,由天津大学数据库课题组贡献。本次开源了由系统标注结果获取的近2万个实体以及4千多个关系,并处理分割成为训练集、校验集、测试集等文件, 可供自然语言处理中命名实体识别和关系抽取任务直接使用。该基准及数据集能够为基于史书的历史知识图谱构建提供数据支持,以通过高度关联化数据的方式构造及展现数字人文内容。
Nguồn: 基于众包标注系统的文言文语言理解测评基准及数据集
Thông tin khác
| Miền | Giá trị | 
|---|---|
| Data last updated | 12 tháng 8, 2021 | 
| Metadata last updated | 12 tháng 8, 2021 | 
| Được tạo ra | 12 tháng 8, 2021 | 
| Định dạng | TXT | 
| Giấy phép | Creative Commons Attribution | 
| Datastore active | False | 
| Has views | True | 
| Id | f52b341a-897f-4f9f-af11-5e0acd01d1fb | 
| Package id | 956b50fe-1196-4f9c-9f78-aac1b60eab6e | 
| Position | 4 | 
| State | active | 
| Url type | upload |