-
基于众包标注系统的文言文语言理解测评基准及数据集
C-CLUE是一个基于众包标注系统构建的文言文语言理解测评基准及数据集,由天津大学数据库课题组贡献。本次开源了由系统标注结果获取的近2万个实体以及4千多个关系,并处理分割成为训练集、校验集、测试集等文件,... -
天津大学开源查询回答系统-SUMA
一种基于部分物化方法的高效的查询回答系统; 支持OWL 2 DL本体,并且以Pellet为完备性评估标准,SUMA在8个测试查询上完备性高于PAGOdA; 采用低复杂度的物化算法并且为数据和规则构建三级索引,实现高效的物化; 支持单机亿级规模的三元组实时推理,在三个Benchmark数据集上预处理时间(包括物化时间)比PAGOdA快七倍;...