Instacart Market Basket Analysis small
收藏BigML2026-05-09 更新2025-01-04 收录
下载链接:
https://bigml.com/user/czuriaga/gallery/dataset/5a7a2e4392fb563c2d000cef
下载链接
链接失效反馈官方服务:
资源简介:
Small version of the Instacart Market Basket Analysis
Processed dataset of orders, with several products bought in each order. Dataset prepared for Association Discovery between items (products)
- 131,209 orders
- from 131,209 different users
- 1,384,617 products bought (39,123 different products)
Dataset structure:
- order_id: Order ID
- user_id: User ID
- order_number: Order number for a user set of orders
- order_dow: Order day of week (0 to 6)
- order_hour_of_day: Order hour of day (0 to 23)
- days_since_prior_order: Number of days since the previous order of the same user
- products: List of products bought in the order, separated by pipe ( | )
Source:
[Instacart Market Basket Analysis at Kaggle](https://www.kaggle.com/c/instacart-market-basket-analysis) based on [3 Million Instacart Orders, Open Sourced blog post](https://tech.instacart.com/3-million-instacart-orders-open-sourced-d40d29ead6f2)
本数据集为Instacart市场篮子分析(Instacart Market Basket Analysis)精简版本,为经预处理的订单数据集,每份订单包含多件已购商品,专为开展商品间关联发现任务而构建。
- 共计131,209份订单
- 覆盖131,209位独立用户
- 累计售出1,384,617件商品,涵盖39,123种不同单品
数据集字段结构如下:
- order_id:订单编号
- user_id:用户编号
- order_number:用户名下订单的序列编号
- order_dow:订单下单星期几(取值范围为0至6)
- order_hour_of_day:订单下单小时(取值范围为0至23)
- days_since_prior_order:该用户上一次下单以来的间隔天数
- products:本次订单购买的商品列表,以竖线(|)作为分隔符
数据来源:
[Kaggle平台Instacart市场篮子分析竞赛](https://www.kaggle.com/c/instacart-market-basket-analysis),原始数据源自《300万份Instacart订单开源》博客文章(https://tech.instacart.com/3-million-instacart-orders-open-sourced-d40d29ead6f2)
创建时间:
2018-02-06
原始信息汇总
Instacart Market Basket Analysis small 数据集概述
基本信息
- 数据集名称: Instacart Market Basket Analysis small
- 数据集大小: 39.1 MB
- 字段数量: 7
- 实例数量: 131,209
- 创建时间: Tue, 6 Feb 2018 22:37:55 +0000
- 发布时间: Mon, 12 Feb 2018 11:27:09 +0000
- 数据集URL: https://bigml.com/user/czuriaga/gallery/dataset/5a7a2e4392fb563c2d000cef
描述
- 概述: Instacart Market Basket Analysis的小型版本,用于商品(产品)之间的关联发现。
- 数据内容:
- 131,209个订单
- 来自131,209个不同的用户
- 1,384,617个购买的产品(39,123种不同的产品)
数据集结构
| 字段名 | 描述 |
|---|---|
| order_id | 订单ID |
| user_id | 用户ID |
| order_number | 用户订单集中的订单编号 |
| order_dow | 订单的星期几(0到6) |
| order_hour_of_day | 订单的小时(0到23) |
| days_since_prior_order | 同一用户的上一个订单以来的天数 |
| products | 订单中购买的产品列表,用竖线( |
来源
- 原始数据: Instacart Market Basket Analysis at Kaggle based on 3 Million Instacart Orders, Open Sourced blog post
标签
- Orders
- Products
- Basket Market
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是Instacart市场篮子分析的一个小型版本,包含131,209个订单和1,384,617个购买产品(39,123种不同产品),用于产品之间的关联发现。数据集结构包括订单ID、用户ID、订单编号、订单星期几、订单小时、上次订单间隔天数和购买产品列表等字段。
以上内容由遇见数据集搜集并总结生成



