中文通用百科知识图谱(CN-DBpedia)

介绍

CN-DBpedia是由复旦大学知识工场实验室研发并维护的大规模通用领域结构化百科,其前身是复旦GDM中文知识图谱

CN-DBpedia主要从中文百科类网站(如百度百科、互动百科、中文维基百科等)的纯文本页面中提取信息,经过滤、融合、推断等操作后,最终形成高质量的结构化数据,供机器和人使用。

CN-DBpedia自2015年12月份发布以来已经在问答机器人、智能玩具、智慧医疗、智慧软件等领域产生3.5亿次API调用量。

Dump

CN-DBpedia目前提供Dump数据下载。包含900万+的百科实体以及6700万+的三元组关系。其中mention2entity信息110万+,摘要信息400万+,标签信息1980万+,infobox信息4100万+

Dump数据仅供学术研究使用,商用请联系我们获取授权。

最新数据请直接访问CN-DBpedia API 如需大规模调用请联系info.knowledgeworks@gmail.com索取APIKEY

引用

如果你需要引用我们的文章,请引用:

Bo Xu, Yong Xu, Jiaqing Liang, Chenhao Xie, Bin Liang, Wanyun Cui, and Yanghua Xiao. CN-DBpedia: A Never-Ending Chinese Knowledge Extraction System. In International Conference on Industrial, Engineering and Other Applications of Applied Intelligent Systems, pp. 428-438. Springer, Cham, 2017.

数据与资源

其他信息

价值
作者 肖仰华
维护者 徐波
最近更新 十二月 4, 2018, 03:28 (UTC)
创建的 十二月 4, 2018, 03:28 (UTC)