ASOS GraphReturns
收藏arXiv2023-03-12 更新2024-06-21 收录
下载链接:
https://osf.io/c793h/
下载链接
链接失效反馈官方服务:
资源简介:
ASOS GraphReturns数据集由大型在线时尚零售商ASOS创建,旨在解决预测客户退货的挑战。该数据集包含约290万条记录,涵盖2021年9月至11月的购买和退货数据,涉及约77万至82万独特客户和约41万产品变体。数据集自然形成图结构,适用于图表示学习,特别是用于开发图神经网络模型以提高退货预测的准确性。该数据集的应用领域主要集中在通过预测退货来优化客户体验和减少零售成本,同时支持可持续发展目标。
The ASOS GraphReturns dataset was developed by ASOS, a large global online fashion retailer, to tackle the challenge of customer return prediction. It contains approximately 2.9 million records covering purchase and return data from September to November 2021, involving roughly 770,000 to 820,000 unique customers and about 410,000 product variants. The dataset naturally exhibits a graph structure, making it well-suited for graph representation learning, especially for building graph neural network (GNN) models to enhance the accuracy of return prediction. Its main application scenarios focus on optimizing customer experience and reducing retail operational costs through return prediction, while also supporting sustainable development goals.
提供机构:
伦敦大学学院
创建时间:
2023-02-28
搜集汇总
数据集介绍

构建方式
在时尚零售领域,客户退货预测是优化运营效率的关键环节。ASOS GraphReturns数据集由知名在线时尚零售商ASOS构建,其数据来源于2021年9月至11月期间的真实交易记录。该数据集以异构图结构组织,包含约77万至82万匿名客户节点和约41万产品变体节点,通过140万至150万条带标签的购买事件边连接。每条边标注了退货与否的二元标签,同时节点附带了客户人口统计特征、产品属性及历史退货原因分布等多维度特征。数据构建过程中特别引入了虚拟节点,如客户所在国家、产品品牌、产品类型和主要退货原因,以增强图结构的语义丰富性。
使用方法
该数据集主要用于客户退货预测的边分类任务,为图表示学习算法提供了标准评估基准。研究人员可首先将原始数据重构为包含客户、产品变体及各类虚拟节点的异构图,并利用节点特征和边标签进行模型训练。典型工作流程包括:采用图神经网络学习节点嵌入,通过消息传递机制聚合邻域信息,最终使用多层感知机等分类器对边进行预测。数据集中已划分训练集与测试集,便于模型性能的客观比较。此外,研究者可针对特定国家市场或产品品牌进行子集分析,探索模型在不同场景下的泛化能力。数据集的结构也支持将其应用于推荐系统优化,通过预测退货概率来指导个性化产品建议。
背景与挑战
背景概述
在电子商务与时尚零售领域,客户退货预测已成为优化运营效率与实现可持续发展目标的关键研究课题。ASOS GraphReturns数据集由伦敦大学学院与ASOS人工智能团队于2023年联合发布,旨在构建一个面向图表示学习的时尚零售数据基准。该数据集采集自全球知名时尚电商ASOS在2021年9月至11月间的真实交易记录,包含超过150万条标注退货状态的购买事件,覆盖77万匿名用户与41万商品变体。其核心研究问题在于如何通过图神经网络等先进方法,精准预测用户购买后的退货行为,从而为个性化推荐与供应链优化提供数据驱动决策支持。该数据集的发布不仅填补了时尚零售领域公开图结构数据的空白,更为推荐系统与图表示学习交叉研究开辟了新的实证路径。
当前挑战
该数据集致力于解决时尚电商场景下的客户退货预测问题,其核心挑战在于如何从高度异构的用户-商品交互数据中捕捉复杂的退货行为模式。传统机器学习方法难以有效建模用户偏好、商品属性与退货决策间的非线性关联,而图结构数据中存在的类别不平衡与特征稀疏性进一步增加了预测难度。在数据构建过程中,研究团队面临多重挑战:首先需在保护用户隐私的前提下实现数据匿名化处理,同时保持图结构的完整性;其次,如何定义虚拟节点以构建富有信息量的异构图拓扑,需要深入理解时尚零售领域的业务逻辑;此外,数据中存在的极端退货率分布可能导致图神经网络训练过程中的过度平滑现象,需设计针对性的采样策略以增强模型鲁棒性。这些挑战共同推动了对新型图表示学习架构与领域适应方法的研究需求。
常用场景
经典使用场景
在时尚零售领域,ASOS GraphReturns数据集为图表示学习提供了天然的应用场景。该数据集将顾客与产品变体之间的购买事件构建为带标签的边,形成异构图结构,其中节点包含丰富的匿名化特征。这种结构使得研究者能够直接运用图神经网络进行边分类任务,预测顾客退货行为。通过引入虚拟节点连接国家、品牌、产品类型等实体,数据集进一步增强了图结构的表达能力,为探索消息传递机制与图嵌入技术提供了理想的实验平台。
解决学术问题
该数据集有效解决了时尚电商领域缺乏高质量标注数据的学术困境。通过提供包含真实退货标签的大规模异构图数据,它使得研究者能够系统探索图表示学习在边分类任务中的性能边界。数据集揭示了传统机器学习模型在处理复杂关系数据时的局限性,同时验证了图神经网络在捕捉顾客-产品交互动态方面的优越性。其贡献在于为图学习社区提供了可重复评估的基准,推动了跨领域研究方法在零售场景中的融合创新。
实际应用
在实际电商运营中,该数据集支撑的退货预测系统能够显著降低物流成本与环境足迹。通过实时分析顾客特征与产品属性的交互模式,系统可在购买环节生成个性化建议,例如推荐更合适的尺寸或款式。这种干预机制不仅提升了顾客满意度,还帮助零售商优化库存管理与供应链规划。数据集涵盖的多国市场特征使得模型能够适应区域消费差异,为全球化零售企业提供了可扩展的智能决策支持框架。
数据集最近研究
最新研究方向
在时尚零售领域,ASOS GraphReturns数据集的推出为图表示学习技术开辟了新的应用前沿。该数据集以匿名化的顾客与产品交互数据为核心,天然具备图结构特性,促使研究者聚焦于图神经网络在预测顾客退货行为中的潜力。前沿研究正探索如何利用神经消息传递机制,从异构图中提取深层语义特征,以提升退货预测的准确性与鲁棒性。热点事件包括将图嵌入技术融入推荐系统,旨在通过个性化建议降低退货率,从而应对时尚产业面临的财务与环境挑战。这一方向不仅推动了跨学科合作,也为可持续电子商务的发展提供了数据驱动的洞察,具有显著的行业影响与学术价值。
相关研究论文
- 1A Dataset for Learning Graph Representations to Predict Customer Returns in Fashion Retail伦敦大学学院 · 2023年
以上内容由遇见数据集搜集并总结生成



