BTC2019数据集: Billion Triple Challenge 2019 Dataset

BTC数据集是从2018/12/12到2019/01/11使用LDspider进行大规模RDF爬取的数据,数据以四元组的形式存储,第四个元素编码相关联的三元组从web文档解析的位置。数据集包含了2,155,856,033个四元组, 从394个付费级域中的2,641,253个RDF文档中收集。把数据合并到一个RDF图中会产生256,059,356个不同的三元组,这些数组 (四元组或三元组)包含了38,156个不同的谓词和120,037个不同类的实例。

数据与资源

其他信息

价值
https://zenodo.org/record/2634588#.XS07WJMzZTY
最近更新 十一月 1, 2024, 01:48 (UTC)
创建的 七月 17, 2019, 03:48 (UTC)