基于众包标注系统的文言文语言理解测评基准及数据集 - 命名实体识别-测试集-文本文件

Dataset description:

C-CLUE是一个基于众包标注系统构建的文言文语言理解测评基准及数据集，由天津大学数据库课题组贡献。本次开源了由系统标注结果获取的近2万个实体以及4千多个关系，并处理分割成为训练集、校验集、测试集等文件，可供自然语言处理中命名实体识别和关系抽取任务直接使用。该基准及数据集能够为基于史书的历史知识图谱构建提供数据支持，以通过高度关联化数据的方式构造及展现数字人文内容。

Nguồn: 基于众包标注系统的文言文语言理解测评基准及数据集

Thông tin khác

Miền	Giá trị
Data last updated	12 tháng 8, 2021
Metadata last updated	12 tháng 8, 2021
Được tạo ra	12 tháng 8, 2021
Định dạng	TXT
Giấy phép	Creative Commons Attribution
Datastore active	False
Has views	True
Id	f52b341a-897f-4f9f-af11-5e0acd01d1fb
Package id	956b50fe-1196-4f9c-9f78-aac1b60eab6e
Position	4
State	active
Url type	upload

Miền

Giá trị

Data last updated

12 tháng 8, 2021

Metadata last updated

12 tháng 8, 2021

Được tạo ra

12 tháng 8, 2021

Định dạng

TXT

Giấy phép

Creative Commons Attribution

Datastore active

False

Has views

True

f52b341a-897f-4f9f-af11-5e0acd01d1fb

Package id

956b50fe-1196-4f9c-9f78-aac1b60eab6e

Position

State

active

Url type

upload

命名实体识别-测试集-文本文件

Dataset description:

Embed resource view

Thông tin khác