200万条商品画像数据

使用说明: 每一行表示一条商品信息,包括字段:

  1. 商品标题
  2. 商品url
  3. 价格
  4. 商品描述
  5. 品牌
  6. 对应百分点类目

用‘\t’分割。

本数据是百分点在7年运营过程中积累的产品画像数据的小结,百分点自建了丰富的电商品分类体系和媒体分类体系,数据中我们用美元符号“$”分割子类目。这些数据在百分点内部用于构建用户画像、支撑个性化推荐、进行销量预测等多类应用。研究者可以通过本数据:

  1. 了解全网产品类目体系和品牌,并根据自身需求构建个性化的分类体系和品牌库,以及相应的类目词库和品牌词库;

  2. 用来作为商品分类的训练数据,据此建立自动分类模型;

  3. 用来作为品牌分类的训练数据,据此建立自动品牌预测模型;

  4. 用来作为商品价格样本。数据中每条记录都有该商品的价格(单位:元),可以据此构建价格预测模型,或者商品消费等级模型。

数据与资源

其他信息

价值
作者 bfd
版本 1.0
最近更新 十二月 30, 2016, 06:11 (UTC)
创建的 十二月 30, 2016, 06:11 (UTC)