ulabox_orders_with_categories_partials_2017

github2023-08-22 更新2024-05-31 收录

下载链接：

https://github.com/ulabox/datasets

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含2017年初的30,000个匿名订单子集，涵盖了各种客户，包括城市和农村地区的新老客户。数据集中的特征包括客户ID、订单ID、购买的商品总数、折扣百分比、支付订单的星期几和时间，以及在网站主要类别中花费的百分比。

This dataset comprises a subset of 30,000 anonymized orders from early 2017, encompassing a diverse range of customers, including both new and returning clients from urban and rural areas. The features within the dataset include customer ID, order ID, the total number of items purchased, discount percentage, the day of the week and time the order was paid, as well as the percentage of spending in the main categories on the website.

创建时间：

2017-09-21

原始信息汇总

Ulabox datasets

Ulabox orders with categories partials 2017

Overview

File: ulabox_orders_with_categories_partials_2017.csv
Analysis: Example analysis in jupyter
Size: 30k orders
Customers: Around 10k, representing various demographics and loyalty levels.

Data Features

customer: Anonymized customers id.
order: Order id, starting from zero.
total_items: The number of items purchased in the order.
discount%: The percent of total discount received.
weekday: Day of the week when the order was paid (1=Monday, 7=Sunday).
hour: The hour of the day the purchase was done (00 to 23).
Categories partials: Percent of money spent in each of the 8 main categories:
- Food%
- Fresh%
- Drinks%
- Home%
- Beauty%
- Health%
- Baby%
- Pets%

Citation

The Ulabox Online Supermarket Dataset 2017, accessed from https://www.github.com/ulabox/datasets

搜集汇总

数据集介绍

构建方式

ulabox_orders_with_categories_partials_2017数据集基于西班牙领先的在线杂货平台Ulabox的2017年初订单数据构建。该数据集包含了30,000条匿名订单记录，涵盖了约10,000名来自城市和农村地区的顾客，包括首次购买者和忠实客户。数据通过匿名化处理，确保用户隐私的同时保留了订单的详细信息，如购买时间、折扣比例以及各类别商品的消费比例。

特点

该数据集的特点在于其多维度的订单信息，涵盖了顾客ID、订单ID、购买商品总数、折扣比例、购买时间（星期几和小时）以及八大类商品的消费比例。这些类别包括食品、新鲜食品、饮料、家居用品、美容产品、健康产品、婴儿用品和宠物用品。通过这些特征，研究者可以深入分析顾客的购买行为和消费偏好，尤其是在不同时间和商品类别上的分布情况。

使用方法

该数据集适用于多种分析场景，如顾客行为分析、市场细分、时间序列分析以及商品类别偏好研究。研究者可以通过Jupyter Notebook等工具加载CSV文件，利用Python或R等编程语言进行数据处理和可视化分析。数据集中的时间特征（如星期几和小时）可用于探索购买行为的周期性规律，而商品类别消费比例则有助于识别不同顾客群体的消费习惯。

背景与挑战

背景概述

ulabox_orders_with_categories_partials_2017数据集由西班牙领先的在线杂货零售商Ulabox于2017年创建，旨在提供其平台上匿名化的订单数据，以支持电子商务和消费者行为研究。该数据集包含了来自约10,000名顾客的30,000笔订单，涵盖了从首次购买者到忠实客户的广泛用户群体。数据集中详细记录了每笔订单的商品数量、折扣比例、购买时间以及顾客在不同商品类别上的消费比例。这些信息为研究在线购物行为、顾客偏好和市场趋势提供了宝贵的数据支持，尤其对零售业和市场营销领域的研究具有重要影响。

当前挑战

该数据集在解决在线零售领域的消费者行为分析问题时面临多重挑战。首先，数据的匿名化处理虽然保护了用户隐私，但也限制了研究者对个体消费者行为的深入分析。其次，数据集中包含的类别消费比例信息虽然丰富，但如何有效整合这些多维度数据以揭示潜在的消费模式仍是一个难题。此外，数据集的构建过程中，如何确保数据的准确性和一致性，尤其是在处理大量订单和多样化商品类别时，也是一个技术上的挑战。这些挑战要求研究者在数据分析和模型构建中采用更为精细和创新的方法。

常用场景

经典使用场景

在电子商务和消费者行为研究领域，ulabox_orders_with_categories_partials_2017数据集被广泛应用于分析在线杂货购买模式。研究者通过该数据集能够深入探讨不同类别商品的购买比例、折扣对购买决策的影响以及消费者在不同时间段（如工作日与周末）的购物行为差异。这些分析为理解消费者偏好和市场趋势提供了宝贵的数据支持。

解决学术问题

该数据集解决了电子商务研究中关于消费者购买行为的多个关键问题。例如，通过分析不同类别商品的购买比例，研究者可以揭示消费者对健康、美容、宠物等特定类别商品的偏好。此外，数据集中的时间信息（如星期几和小时）为研究购物行为的周期性变化提供了基础，帮助学者理解促销活动对消费者购买决策的影响。

衍生相关工作

基于ulabox_orders_with_categories_partials_2017数据集，许多经典研究工作得以展开。例如，一些研究聚焦于消费者对健康类商品的偏好变化，揭示了健康意识对购买行为的影响。另一些研究则利用时间序列分析方法，探讨了促销活动对销售量的短期和长期效应。这些研究不仅丰富了电子商务领域的理论体系，还为实践提供了可操作的指导。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集