OmniBehavior

github2026-04-09 更新2026-04-10 收录

下载链接：

https://github.com/icip-cas/OmniBehavior

下载链接

链接失效反馈

官方服务：

资源简介：

OmniBehavior是一个捕捉快手平台上多种交互场景中真实用户行为的数据集，包括视频浏览、直播、电子商务、广告、客户服务和搜索行为等。数据集覆盖了90天的用户行为，提供了长期观察和跨领域行为分析的机会。

OmniBehavior is a dataset that captures real user behaviors across diverse interactive scenarios on the Kuaishou platform, including video browsing, live streaming, e-commerce, advertising, customer service, and search behaviors, among others. The dataset spans 90 days of user behavioral data, providing opportunities for long-term observational research and cross-domain behavioral analysis.

创建时间：

2026-04-09

原始信息汇总

OmniBehavior 数据集概述

数据集简介

OmniBehavior 是一个旨在模拟真实世界人类行为的数据集，专注于对大型语言模型在长周期、跨场景、异构行为轨迹上的基准测试。

关键时间节点

预计发布日期：完整数据集和评估代码预计于 2026年5月 左右，在完成正式数据审计后发布。
论文发布：相关研究论文已于 2026年4月10日发布。

数据场景覆盖

数据集捕捉了用户在快手平台多个交互场景中的真实行为，具体包括：

视频浏览：与浏览和观看短视频相关的行为。
直播：在直播房间内的互动（如观看时长、评论、点赞、送礼）。
电子商务：购物活动，如浏览商品、管理购物车和购买。
广告：用户与推荐广告的互动（浏览、点击、转化）。
客户服务：与电子商务客服代理的聊天记录和互动。
搜索行为：应用内的所有搜索活动，包括但不限于视频和商城查询。

演示数据说明

data/demo.json 文件提供了本项目使用的数据格式示例。

数据性质：该文件包含单个用户的部分数据子集，仅用于演示和测试目的。
完整数据：完整数据集将在正式数据审计后公开提供。

演示数据亮点

演示数据集展示了一个快手用户的案例研究，具有以下特点：

长期观察：数据时间跨度达 90天（从 2025-09-01 到 2025-11-30），为观察用户兴趣演变和习惯模式提供了充足的时间线。
真实互动：数据集包含大量真实行为，记录了用户互动的一致且详细的轨迹。
全面场景覆盖：其模式支持捕捉主流短视频平台场景中的行为。

案例研究价值

尽管 demo.json 仅展示单个用户，但其深度使其成为有价值的研究资源：

长期兴趣建模：3个月的时间跨度允许具体追踪兴趣随时间的转移和稳定性。
跨领域行为分析：通过覆盖多样化场景，支持研究一个领域（如观看主播）的行为如何与另一个领域（如购买商品或点击广告）的行动相关联。
用户行为模拟：这种详细的轨迹为构建用户模拟器提供了真实依据，可用于评估智能体在复杂环境中模拟真实、长期人类行为模式的能力。

数据结构

数据按用户ID组织。每个用户条目包含一个文本描述的用户档案和一个按时间顺序排列的行为历史记录。基本结构如下所示： json { "user_ID": { "user_profile": "用户描述（如人口统计特征、教育背景等）...", "action_history": [ { "type": "场景类型", "timestamp": "YYYY-MM-DD HH:MM:SS", "context": { "field_name": "value", ... }, "action": [ { "type": "specific_behavior", "attribute": "value" } ... ] }, ... ] } }

使用许可

该数据集严格禁止用于商业用途，仅用于学术研究目的。

引用

若您的研究认为本工作有用，请考虑引用我们的论文： bibtex @misc{chen2026omnibehavior, title={Towards Real-world Human Behavior Simulation: Benchmarking Large Language Models on Long-horizon, Cross-scenario, Heterogeneous Behavior Traces}, author={Jiawei Chen and Ruoxi Xu and Boxi Cao and Ruotong Pan and Yunfei Zhang and Yifei Hu and Yong Du and Tingting Gao and Yaojie Lu and Yingfei Sun and Xianpei Han and Le Sun and Xiangyu Wu and Hongyu Lin}, year={2026}, eprint={2604.XXXXX}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2604.XXXXX}, }

搜集汇总

数据集介绍

构建方式

在数字行为分析领域，OmniBehavior数据集通过采集快手平台上的真实用户交互记录构建而成。该数据集覆盖了视频浏览、直播互动、电子商务、广告响应、客户服务及搜索行为六大核心场景，旨在捕捉用户在多元环境中的长期行为轨迹。数据以用户为单位进行组织，每条记录包含用户画像及按时间顺序排列的行为历史，确保了行为序列的时序完整性与场景多样性。构建过程中遵循严格的隐私保护与数据审计流程，为后续的学术研究提供了可靠且丰富的实证基础。

特点

OmniBehavior数据集以其长周期、跨场景与异构行为轨迹的综合性而著称。数据集涵盖了长达90天的用户行为观察窗口，能够细致刻画兴趣演化与习惯形成的动态过程。其多场景架构允许研究者探索不同领域行为间的关联性，例如直播观看与商品购买之间的交叉影响。此外，数据中蕴含的真实交互动作为构建高保真用户模拟器提供了关键支撑，使得基于该数据集的行为建模与仿真评估更具现实意义。

使用方法

该数据集主要面向学术研究，适用于长期兴趣建模、跨领域行为分析及用户行为仿真等任务。研究者可依据用户ID索引访问其行为历史，利用时序动作序列训练或评估行为预测模型。通过整合用户画像与多场景上下文信息，能够深入探究行为模式的形成机制与影响因素。在使用过程中需严格遵守非商业用途许可，确保数据应用的合规性与伦理性，从而推动人类行为模拟研究向真实世界场景的有效延伸。

背景与挑战

背景概述

在数字交互时代，模拟真实用户行为对于推动推荐系统、人机交互及行为科学的发展至关重要。OmniBehavior数据集由快手平台的研究团队于2026年创建，旨在捕捉用户在短视频浏览、直播互动、电子商务、广告响应、客户服务及搜索行为等多场景下的长期、跨领域、异构行为轨迹。该数据集的核心研究问题聚焦于如何利用大规模语言模型对复杂人类行为进行高保真仿真，以解决传统行为建模中存在的场景割裂与短期观测局限。其发布为学术界提供了首个覆盖主流短视频平台全场景的实时行为基准，显著促进了用户兴趣演化建模与智能体仿真评估领域的研究进展。

当前挑战

OmniBehavior数据集致力于解决真实世界人类行为仿真中的核心挑战，即在长时域、跨场景、异构行为轨迹下实现精准建模。领域问题的挑战主要体现在行为模式的动态性与场景间的耦合性，例如用户兴趣随时间的非线性漂移，以及视频浏览与电商购买行为间的复杂关联，这要求模型具备强大的时序推理与跨域迁移能力。在构建过程中，研究团队面临数据采集与处理的严峻挑战，包括多源异构日志的整合、用户隐私保护下的数据脱敏，以及长达90天的连续行为轨迹的质量控制与标注一致性维护，这些因素共同增加了数据集构建的复杂度与可靠性保障难度。

常用场景

经典使用场景

在数字行为分析领域，OmniBehavior数据集为研究长时程、跨场景的用户行为轨迹提供了关键基准。其经典使用场景聚焦于模拟真实世界人类行为，通过涵盖视频浏览、直播互动、电子商务、广告响应、客户服务及搜索行为等多重交互场景，支持构建复杂的用户行为仿真模型。该数据集尤其适用于评估大型语言模型在异构行为序列上的预测与生成能力，为行为动力学研究提供了丰富的实证基础。

实际应用

在实际应用层面，OmniBehavior数据集为短视頻平台如快手的用户体验优化与商业智能提供了直接支持。其涵盖的电子商务、广告转化及客户服务等场景，使得企业能够基于真实行为数据训练精准的推荐算法与营销策略。同时，该数据集在构建用户模拟器方面的价值，有助于测试和验证智能客服、内容分发系统在复杂环境中的表现，从而提升平台的服务效率与用户满意度，体现了从学术研究到产业落地的桥梁作用。

衍生相关工作

围绕OmniBehavior数据集，已衍生出多项经典研究工作，主要集中在长时程行为预测、跨场景迁移学习以及异构行为序列建模等领域。这些工作利用该数据集的多场景覆盖与时间连续性，开发了新型的神经网络架构与强化学习框架，以模拟人类在数字环境中的决策过程。此外，基于OmniBehavior的基准测试已成为评估大型语言模型在行为生成任务上性能的重要标准，推动了行为仿真与人工智能交叉学科的创新进展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集