OPeRA

Name: OPeRA
Creator: 东北大学, 南加州大学, 石溪大学, 独立研究者, 俄亥俄州立大学, 圣母大学, 哥伦比亚大学
Published: 2025-06-06 05:37:49
License: 暂无描述

arXiv2025-06-06 更新2025-06-10 收录

下载链接：

https://arxiv.org/abs/2506.05606

下载链接

链接失效反馈

官方服务：

资源简介：

OPeRA数据集是第一个公开的综合数据集，它从真实的在线购物会话中收集了观察、个性、理由和行动数据。该数据集包含54个不同用户的740个购物会话，共有36,691个<观察，行动>对和721个用户注释的理由。数据集通过一个定制的浏览器插件收集，该插件记录了用户的互动行为和相应的网络环境，并在决策点触发理由提示。OPeRA数据集为研究大型语言模型（LLM）在模拟人类在线购物行为方面的能力提供了基础。

The OPeRA dataset is the first publicly available comprehensive dataset that collects observation, personality, rationale, and action data from real-world online shopping sessions. This dataset contains 740 shopping sessions from 54 distinct users, totaling 36,691 <observation, action> pairs and 721 user-annotated rationales. It was collected via a custom browser extension that records users' interactive behaviors and the corresponding network environment, and triggers rationale prompts at decision points. The OPeRA dataset provides a foundation for researching the capabilities of Large Language Models (LLMs) in simulating human online shopping behaviors.

提供机构：

东北大学, 南加州大学, 石溪大学, 独立研究者, 俄亥俄州立大学, 圣母大学, 哥伦比亚大学

创建时间：

2025-06-06

原始信息汇总

数据集概述：OPeRA

基本信息

标题: OPeRA: A Dataset of Observation, Persona, Rationale, and Action for Evaluating LLMs on Human Online Shopping Behavior Simulation
作者: Ziyi Wang, Yuxuan Lu, Wenbo Li, Amirali Amini, Bo Sun, Yakov Bart, Weimin Lyu, Jiri Gesi, Tian Wang, Jing Huang, Yu Su, Upol Ehsan, Malihe Alikhani, Toby Jia-Jun Li, Lydia Chilton, Dakuo Wang
提交日期: 2025年6月5日
arXiv标识符: arXiv:2506.05606
DOI: 10.48550/arXiv.2506.05606 (pending registration)

数据集描述

目的: 评估大型语言模型(LLMs)在模拟特定用户网络行为方面的能力，尤其是预测用户在在线购物时的下一步行为和推理过程。
内容:
- 用户画像(persona)
- 浏览器观察数据(browser observations)
- 细粒度网络行为(fine-grained web actions)
- 实时自我报告的行为理由(self-reported just-in-time rationales)
采集方式: 通过在线问卷和定制浏览器插件高保真收集。
特点: 首个公开数据集，全面捕捉用户在在线购物过程中的可观察行为及其内部推理。

研究领域

主要领域: 计算与语言(Computation and Language)
次要领域: 人机交互(Human-Computer Interaction)

相关资源

PDF全文: View PDF
HTML全文: View HTML (experimental)
TeX源码: TeX Source

搜集汇总

数据集介绍

构建方式

OPeRA数据集的构建采用了多模态数据采集方法，通过定制化浏览器插件ShoppingFlow实时捕获用户在亚马逊购物平台的全流程交互行为。研究团队招募了54名真实用户，在四周内记录了36,691组<观察,动作>对和721条即时标注的行为动机。数据采集系统由三个核心组件构成：(1)基于规则的事件监听器捕捉细粒度交互动作；(2)动态触发式问卷收集用户决策动机；(3)结构化访谈获取多维用户画像。所有数据经过严格的匿名化处理，采用时间阈值和购买信号双重策略进行会话分割，确保行为序列的完整性和隐私安全性。

特点

作为首个融合环境观察、用户画像、行为动机和操作动作的多维数据集，OPeRA具有三个显著特征：其一，通过语义标注将原始HTML元素映射为可解释的交互意图（如'search_result.product_name'），实现网页上下文的结构化表征；其二，创新性地采用概率触发机制（8%）收集即时决策动机，捕获'行为-认知'的时序对齐关系；其三，整合心理学量表和开放式访谈构建动态用户画像，包含大五人格、消费风格指数等23个维度的特征向量。相较于现有数据集，其独特价值在于同步记录行为表象（what）与认知机理（why）。

使用方法

该数据集支持两种典型应用范式：在行为预测任务中，研究者可将用户历史动作序列、环境观察和人格特征作为输入，训练模型预测下一个交互动作（点击/输入/购买），评估指标采用精确匹配准确率；在联合推理任务中，需同步生成符合用户特征的决策动机和行为动作，通过BERTScore和ROUGE-L衡量动机生成的合理性。实验表明，输入数据应保持时序完整性，建议将单次会话长度控制在50-150个动作区间。值得注意的是，用户画像信息的有效利用需要设计特定的注意力机制，单纯拼接特征可能导致性能下降。

背景与挑战

背景概述

OPeRA数据集由Northeastern University等机构的研究团队于2025年提出，旨在解决大型语言模型（LLMs）在模拟人类在线购物行为时面临的挑战。该数据集首次全面捕捉了用户行为的多维度特征，包括用户画像、浏览器观察、细粒度网页行为以及实时自我报告的行为动机。通过开发定制浏览器插件和在线问卷，研究团队收集了54名用户的740个购物会话，包含36,691个观察-行为对和721条行为动机注释。该数据集为评估LLMs在个性化数字孪生领域的表现提供了首个基准测试框架，推动了人机交互和电子商务领域的研究进展。

当前挑战

OPeRA数据集面临的核心挑战体现在两个维度：领域问题层面，现有数据集普遍存在行为记录碎片化、缺乏上下文关联的问题，难以捕捉用户决策过程中的连续性和个性化特征；数据构建层面，需克服多模态数据同步采集的技术难题，包括浏览器环境的高保真记录、敏感信息的隐私保护处理，以及非侵入式动机采集方法的有效性验证。具体而言，数据集需要精确对齐时间戳以关联行为与网页上下文，开发自动化规则处理HTML中的动态元素，并通过概率触发机制平衡动机采集的全面性与用户体验。

常用场景

经典使用场景

OPeRA数据集在模拟人类在线购物行为方面具有广泛的应用价值。通过整合用户行为轨迹、网页上下文、用户画像以及即时自我报告的行为动机，该数据集为研究大型语言模型（LLM）在模拟真实用户行为方面的能力提供了坚实基础。其经典使用场景包括评估LLM在给定用户画像和历史交互数据的情况下，预测用户下一步行为及其背后动机的准确性。

衍生相关工作

OPeRA数据集的推出催生了一系列相关研究，特别是在LLM驱动的数字孪生和个性化行为模拟领域。例如，基于OPeRA的后续工作探索了如何利用用户画像和历史交互数据，构建更精准的行为预测模型。此外，该数据集还被用于研究多模态LLM在理解网页上下文和用户行为方面的能力，进一步推动了人机交互和电子商务智能化的发展。

数据集最近研究