five

OPeRA

收藏
arXiv2025-06-06 更新2025-06-10 收录
下载链接:
https://arxiv.org/abs/2506.05606
下载链接
链接失效反馈
官方服务:
资源简介:
OPeRA数据集是第一个公开的综合数据集,它从真实的在线购物会话中收集了观察、个性、理由和行动数据。该数据集包含54个不同用户的740个购物会话,共有36,691个<观察,行动>对和721个用户注释的理由。数据集通过一个定制的浏览器插件收集,该插件记录了用户的互动行为和相应的网络环境,并在决策点触发理由提示。OPeRA数据集为研究大型语言模型(LLM)在模拟人类在线购物行为方面的能力提供了基础。

The OPeRA dataset is the first publicly available comprehensive dataset that collects observation, personality, rationale, and action data from real-world online shopping sessions. This dataset contains 740 shopping sessions from 54 distinct users, totaling 36,691 <observation, action> pairs and 721 user-annotated rationales. It was collected via a custom browser extension that records users' interactive behaviors and the corresponding network environment, and triggers rationale prompts at decision points. The OPeRA dataset provides a foundation for researching the capabilities of Large Language Models (LLMs) in simulating human online shopping behaviors.
提供机构:
东北大学, 南加州大学, 石溪大学, 独立研究者, 俄亥俄州立大学, 圣母大学, 哥伦比亚大学
创建时间:
2025-06-06
原始信息汇总

数据集概述:OPeRA

基本信息

  • 标题: OPeRA: A Dataset of Observation, Persona, Rationale, and Action for Evaluating LLMs on Human Online Shopping Behavior Simulation
  • 作者: Ziyi Wang, Yuxuan Lu, Wenbo Li, Amirali Amini, Bo Sun, Yakov Bart, Weimin Lyu, Jiri Gesi, Tian Wang, Jing Huang, Yu Su, Upol Ehsan, Malihe Alikhani, Toby Jia-Jun Li, Lydia Chilton, Dakuo Wang
  • 提交日期: 2025年6月5日
  • arXiv标识符: arXiv:2506.05606
  • DOI: 10.48550/arXiv.2506.05606 (pending registration)

数据集描述

  • 目的: 评估大型语言模型(LLMs)在模拟特定用户网络行为方面的能力,尤其是预测用户在在线购物时的下一步行为和推理过程。
  • 内容:
    • 用户画像(persona)
    • 浏览器观察数据(browser observations)
    • 细粒度网络行为(fine-grained web actions)
    • 实时自我报告的行为理由(self-reported just-in-time rationales)
  • 采集方式: 通过在线问卷和定制浏览器插件高保真收集。
  • 特点: 首个公开数据集,全面捕捉用户在在线购物过程中的可观察行为及其内部推理。

研究领域

  • 主要领域: 计算与语言(Computation and Language)
  • 次要领域: 人机交互(Human-Computer Interaction)

相关资源

搜集汇总
数据集介绍
main_image_url
构建方式
OPeRA数据集的构建采用了多模态数据采集方法,通过定制化浏览器插件ShoppingFlow实时捕获用户在亚马逊购物平台的全流程交互行为。研究团队招募了54名真实用户,在四周内记录了36,691组<观察,动作>对和721条即时标注的行为动机。数据采集系统由三个核心组件构成:(1)基于规则的事件监听器捕捉细粒度交互动作;(2)动态触发式问卷收集用户决策动机;(3)结构化访谈获取多维用户画像。所有数据经过严格的匿名化处理,采用时间阈值和购买信号双重策略进行会话分割,确保行为序列的完整性和隐私安全性。
特点
作为首个融合环境观察、用户画像、行为动机和操作动作的多维数据集,OPeRA具有三个显著特征:其一,通过语义标注将原始HTML元素映射为可解释的交互意图(如'search_result.product_name'),实现网页上下文的结构化表征;其二,创新性地采用概率触发机制(8%)收集即时决策动机,捕获'行为-认知'的时序对齐关系;其三,整合心理学量表和开放式访谈构建动态用户画像,包含大五人格、消费风格指数等23个维度的特征向量。相较于现有数据集,其独特价值在于同步记录行为表象(what)与认知机理(why)。
使用方法
该数据集支持两种典型应用范式:在行为预测任务中,研究者可将用户历史动作序列、环境观察和人格特征作为输入,训练模型预测下一个交互动作(点击/输入/购买),评估指标采用精确匹配准确率;在联合推理任务中,需同步生成符合用户特征的决策动机和行为动作,通过BERTScore和ROUGE-L衡量动机生成的合理性。实验表明,输入数据应保持时序完整性,建议将单次会话长度控制在50-150个动作区间。值得注意的是,用户画像信息的有效利用需要设计特定的注意力机制,单纯拼接特征可能导致性能下降。
背景与挑战
背景概述
OPeRA数据集由Northeastern University等机构的研究团队于2025年提出,旨在解决大型语言模型(LLMs)在模拟人类在线购物行为时面临的挑战。该数据集首次全面捕捉了用户行为的多维度特征,包括用户画像、浏览器观察、细粒度网页行为以及实时自我报告的行为动机。通过开发定制浏览器插件和在线问卷,研究团队收集了54名用户的740个购物会话,包含36,691个观察-行为对和721条行为动机注释。该数据集为评估LLMs在个性化数字孪生领域的表现提供了首个基准测试框架,推动了人机交互和电子商务领域的研究进展。
当前挑战
OPeRA数据集面临的核心挑战体现在两个维度:领域问题层面,现有数据集普遍存在行为记录碎片化、缺乏上下文关联的问题,难以捕捉用户决策过程中的连续性和个性化特征;数据构建层面,需克服多模态数据同步采集的技术难题,包括浏览器环境的高保真记录、敏感信息的隐私保护处理,以及非侵入式动机采集方法的有效性验证。具体而言,数据集需要精确对齐时间戳以关联行为与网页上下文,开发自动化规则处理HTML中的动态元素,并通过概率触发机制平衡动机采集的全面性与用户体验。
常用场景
经典使用场景
OPeRA数据集在模拟人类在线购物行为方面具有广泛的应用价值。通过整合用户行为轨迹、网页上下文、用户画像以及即时自我报告的行为动机,该数据集为研究大型语言模型(LLM)在模拟真实用户行为方面的能力提供了坚实基础。其经典使用场景包括评估LLM在给定用户画像和历史交互数据的情况下,预测用户下一步行为及其背后动机的准确性。
衍生相关工作
OPeRA数据集的推出催生了一系列相关研究,特别是在LLM驱动的数字孪生和个性化行为模拟领域。例如,基于OPeRA的后续工作探索了如何利用用户画像和历史交互数据,构建更精准的行为预测模型。此外,该数据集还被用于研究多模态LLM在理解网页上下文和用户行为方面的能力,进一步推动了人机交互和电子商务智能化的发展。
数据集最近研究
最新研究方向
近年来,OPeRA数据集在大型语言模型(LLM)模拟人类在线购物行为的研究中引起了广泛关注。该数据集通过整合用户行为轨迹、网页上下文、用户画像及实时自我报告的行为动机,为LLM在个性化行为模拟领域提供了首个公开基准。研究热点集中在如何利用OPeRA的多模态数据(如HTML结构、语义动作标签和自然语言动机)提升模型对用户决策逻辑的细粒度建模能力。例如,2025年多项工作探索了基于动机增强的LLM微调方法(Lu et al., 2025a),以及用户画像与行为序列的联合嵌入技术(Wang et al., 2025b),这些研究显著推动了电商推荐系统、数字孪生代理等应用的发展。该数据集的独特价值在于其真实用户行为与动机的时序对齐特性,为验证LLM行为模拟的可信度提供了关键工具,同时也暴露了现有模型在长序列个性化预测上的局限性,如GPT-4.1在动作预测任务中仅达到18.53%的准确率(arXiv:2506.05606)。
相关研究论文
  • 1
    OPeRA: A Dataset of Observation, Persona, Rationale, and Action for Evaluating LLMs on Human Online Shopping Behavior Simulation东北大学, 南加州大学, 石溪大学, 独立研究者, 俄亥俄州立大学, 圣母大学, 哥伦比亚大学 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作