在线购物用户行为数据集

Name: 在线购物用户行为数据集
Creator: 亚马逊公司，东北大学
Published: 2025-03-27 01:33:27
License: 暂无描述

arXiv2025-03-27 更新2025-03-28 收录

下载链接：

http://arxiv.org/abs/2503.20749v1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由亚马逊公司收集，包含了一个电商平台上的3526名用户的31865个购物会话，总计230965个用户行为。每个会话由一系列时间对齐的<context, action>对组成，context反映了用户观察到的网页（如产品视图、筛选状态），action代表用户的输入（如点击、搜索或会话终止动作）。数据集的最终结果包括4432个购买动作和27433个会话终止动作。此数据集用于严格评估各种LLM在动作级别的模拟人类行为的准确性。

This dataset was collected by Amazon, containing 31,865 shopping sessions from 3,526 users on an e-commerce platform, with a total of 230,965 user behaviors. Each session consists of a series of time-aligned <context, action> pairs, where context reflects the web pages observed by the user (e.g., product views, filtering states), and action represents user inputs such as clicks, searches, or session termination actions. The final dataset includes 4,432 purchase actions and 27,433 session termination actions. This dataset is used to rigorously evaluate the accuracy of various LLMs in simulating human behavior at the action level.

提供机构：

亚马逊公司，东北大学

创建时间：

2025-03-27

搜集汇总

数据集介绍

构建方式

在线购物用户行为数据集构建于全球领先的电商平台，通过系统化采集3,526名用户的31,865个会话数据，形成包含230,965条用户行为的真实场景记录。研究团队创新性地采用Claude 3.5 Sonnet模型生成合成推理轨迹，将原始<上下文，动作>二元组扩展为<上下文，推理，动作>三元组。数据预处理阶段严格遵循标准化流程，包括会话分割、动作分类及上下文结构化处理，最终构建起包含4,432次购买行为和27,433次会话终止行为的完整行为链条。

特点

该数据集的核心价值体现在其多维度行为表征能力，不仅完整记录用户点击、输入、终止等基础操作，更通过简化的HTML结构精准还原网页上下文环境。区别于传统行为数据集，其独特之处在于融合了合成推理轨迹，为理解行为背后的决策逻辑提供语义解释。时序对齐的会话数据结构支持细粒度的过程分析，而大规模真实场景数据确保了行为模式的多样性，涵盖从商品搜索到最终购买的完整决策链条。

使用方法

使用本数据集时，建议采用序列建模框架处理带有时序标记的行为流。输入层应整合历史上下文、动作序列及对应推理轨迹，输出层需同步生成行为预测和语义解释。评估指标包含动作级别精确匹配准确率和会话最终结果的F1值。为充分发挥数据集价值，可采用两阶段训练策略：先基于原始行为数据预训练，再通过推理增强数据微调。注意保持测试集会话独立性，避免数据泄露影响评估效果。

背景与挑战

背景概述

在线购物用户行为数据集由亚马逊公司（Amazon.com, Inc.）与东北大学（Northeastern University）的研究团队于2025年联合构建，旨在通过大规模真实用户行为数据提升大型语言模型（LLMs）在行为模拟任务中的客观准确性。该数据集包含来自3,526名用户的31,865次会话记录，涵盖23万次网页操作行为，聚焦于用户在电子商务环境中的动态决策过程，如搜索、点击和购买行为。其创新性在于首次将时序上下文、用户动作与合成推理轨迹三元组结合，为LLM智能体提供了细粒度的人类行为建模基准，显著推动了人机交互与个性化推荐系统的研究进展。

当前挑战

该数据集面临的核心挑战体现在两个维度：在领域问题层面，现有LLM行为模拟普遍存在‘可信度偏差’——模型生成的行为虽看似合理，但与真实用户动作序列的客观匹配度不足，例如在网页导航决策中仅达到11.86%的动作生成准确率；在构建技术层面，真实用户行为背后的隐式推理逻辑难以直接捕获，研究团队需通过Claude 3.5 Sonnet合成推理轨迹来补全<上下文-动作>对，这种间接标注方式可能引入语义漂移。此外，网页环境的动态复杂性导致动作空间定义困难，需平衡原始浏览器操作（点击/输入）与高层语义动作（加入购物车）之间的抽象粒度。

常用场景

经典使用场景

在线购物用户行为数据集最经典的使用场景是模拟用户在电子商务平台上的浏览和购买行为。通过记录用户在网页上的点击、搜索、终止会话等操作，数据集为研究者提供了丰富的用户行为轨迹。这些数据不仅能够还原真实的购物流程，还能帮助理解用户在决策过程中的行为模式，为构建更精准的用户行为模型奠定基础。

解决学术问题

该数据集解决了行为模拟领域中的关键学术问题，即如何量化评估大语言模型（LLMs）在生成用户行为时的客观准确性。传统方法主要依赖主观的“可信度”评估，而该数据集通过提供大量真实的用户行为序列，使得研究者能够从动作层面精确衡量模型输出与真实行为的一致性。此外，数据集还填补了行为推理轨迹缺失的空白，为理解用户行为背后的逻辑提供了新的研究视角。

衍生相关工作

该数据集衍生了一系列经典研究工作，特别是在大语言模型与行为模拟的结合方面。例如，基于该数据集的研究提出了推理增强的微调方法，显著提升了模型生成行为的准确性。此外，相关工作还探索了多模态模型在网页交互中的应用，进一步扩展了行为模拟的边界。这些研究不仅推动了行为模拟技术的发展，也为其他领域的任务如自动化测试和人机交互提供了新的思路和方法。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集