知识工厂实体链接数据集

基于CN-DBpedia的短文本实体链接测试数据 数据集的文本由1037条人工标注的短文本语料组成。其中大约70%来自新闻语料,包括新闻标题和内容,比如“英超-桑切斯4分钟内梅开二度阿森纳3-2五轮不败”;大约20%来自人工构建的基于歧义实体的语料,比如“红楼梦的演员有哪些”;大约10%来自问答语料中的简单问句,比如说“岳阳有哪些旅游景点”。

数据与资源

其他信息

价值
最近更新 二月 22, 2022, 08:04 (UTC)
创建的 二月 22, 2022, 08:04 (UTC)