StayStill

Name: StayStill
Creator: 巴斯克大学; 艺电
Published: 2026-05-13 23:45:52
License: 暂无描述

arXiv2026-05-13 更新2026-05-15 收录

下载链接：

https://github.com/Enekoassets/StayStill

下载链接

链接失效反馈

官方服务：

资源简介：

StayStill是由巴斯克大学与艺电联合创建的大规模三维空闲动画数据集，旨在填补空闲动作生成领域高质量训练数据的空白。该数据集包含约6小时的运动捕捉数据，源自50名受试者，涵盖了自然空闲动作、使用手机时的空闲状态以及18类标注的典型空闲行为（如抓挠、伸展、查看手表等），数据通过无标记动作捕捉技术采集并经过人工清洗与标注。该数据集主要应用于虚拟角色动画生成、深度学习模型训练及空闲动作动力学研究，致力于推动游戏开发、虚拟现实等领域中角色行为真实感的提升。

StayStill is a large-scale 3D idle animation dataset co-created by the University of the Basque Country and Electronic Arts (EA), aiming to fill the gap of high-quality training data in the field of idle motion generation. This dataset contains approximately 6 hours of motion capture data sourced from 50 subjects, covering natural idle movements, idle states while using mobile phones, and 18 annotated typical idle behaviors such as scratching, stretching, checking a watch, etc. The data was collected using markerless motion capture technology and underwent manual cleaning and annotation. This dataset is mainly applied to virtual character animation generation, deep learning model training and idle motion dynamics research, and is committed to promoting the enhancement of character behavioral realism in fields such as game development and virtual reality.

提供机构：

巴斯克大学; 艺电

创建时间：

2026-05-13

原始信息汇总

StayStill 大规模3D静态动画数据集概述

数据集基本信息

名称: StayStill: a large-scale 3d idle animation dataset
论文地址: https://arxiv.org/abs/2605.13693
数据总量: 约650,000帧静态动作数据
数据格式: BVH文件
下载地址: https://zenodo.org/records/18741736?preview=1&token=eyJhbGciOiJIUzUxMiJ9.eyJpZCI6IjQwYWNhNjgzLWE4ZDAtNDIzMy05ZjY3LWY3NjE0OTA4NWQ0NSIsImRhdGEiOnt9LCJyYW5kb20iOiIxN2VmODE2YmFkZTczNTk2MzQ4YTJhOTYyMTI2N2Y5NyJ9.DjZnwlSgwhod9XOa3by4kmWHKRkt6r_2L25qB-vfvtOqCk2UtmTkJckArcDc3xYLbEm6GlnXiswI1uMs2gKs3g
许可证: MIT License

数据集内容分类

数据集包含三组主要动作类型，每种类型分为两种骨骼版本（Freemocap原始骨架和 LaFAN1重定位骨架）：

1. 一般静态动作（General Idle）

动作名称: idle
帧数: 181,846
时长: 1小时41分01秒
片段数量: 50

2. 使用手机时的静态动作（Idle with a phone）

动作名称: phone
帧数: 187,741
时长: 1小时44分18秒
片段数量: 50

3. 静态行为动作（Idle actions）

共19种具体行为，总计：

帧数: 275,751
时长: 2小时33分11秒
片段数量: 1,534

具体行为包括：

动作名称	名称缩写	帧数	时长	片段数
抬头看天空	l_up	27,943	15:31	98
环顾四周	l_aro	20,338	11:17	92
低头看地面	l_dow	17,817	09:53	85
看鞋子	l_sho	15,623	08:40	75
看手表	l_wat	11,332	06:17	92
看手机	l_pho	21,237	11:47	89
挠头	sc_hea	13,199	07:19	92
挠手臂	sc_arm	13,750	07:38	93
挠腿	sc_leg	11,510	06:23	77
挠背	sc_bac	10,900	06:03	66
摸脸/下巴	t_fac	14,852	08:15	93
伸展手臂	st_arm	14,473	08:02	80
伸展背部	st_bac	12,300	06:50	71
揉眼睛	sc_eye	15,430	08:34	97
打哈欠	yaw	13,766	07:38	95
向左后方看	lb_lef	10,253	05:41	69
向右后方看	lb_rig	10,571	05:52	75
重心左移至右	wei_lr	11,100	06:10	48
重心右移至左	wei_rl	9,357	05:11	47

数据划分

训练集: 受试者 0 1 3 4 5 7 11 12 13 14 16 17 18 20 24 25 26 27 29 30 31 32 33 34 35 36 37 39 41 42 44 46 47 48 49
验证集: 受试者 8 19 21 38 40
测试集: 受试者 2 6 9 10 15 22 23 28 43 45

数据命名规则

action_name[_take_number]_person_ID.bvh

数据清洗

可使用 cleanData.py 脚本（需安装 bvhTools 库）去除因动捕系统检测不佳导致的抖动和错误动作片段，清洗后原始长序列会被分割为多个正确片段（如 idle_00 拆分为 idle_00_1、idle_00_2、idle_00_3）。

配套模型与工具

静态动画生成器: 基于 Qin等人的运动插值网络（Motion In-betweening via Two Stage Transformers）
评估代码: 提供数值评估和用户评估脚本，可复现论文中的比较结果
数据下载: https://zenodo.org/records/18741736?preview=1&token=eyJhbGciOiJIUzUxMiJ9.eyJpZCI6IjQwYWNhNjgzLWE4ZDAtNDIzMy05ZjY3LWY3NjE0OTA4NWQ0NSIsImRhdGEiOnt9LCJyYW5kb20iOiIxN2VmODE2YmFkZTczNTk2MzQ4YTJhOTYyMTI2N2Y5NyJ9.DjZnwlSgwhod9XOa3by4kmWHKRkt6r_2L25qB-vfvtOqCk2UtmTkJckArcDc3xYLbEm6GlnXiswI1uMs2gKs3g
预训练模型下载: https://github.com/Enekoassets/StayStill/releases/tag/Model

引用方式

bibtex @article{atxa2026staystill, title={StayStill: A Large-Scale 3D Idle Animation Dataset}, author={Atxa Landa, Eneko and Rodriguez, Igor and Lazkano, Elena and Kucherenko, Taras}, journal={arXiv preprint arXiv:2605.13693}, year={2026} }

搜集汇总

数据集介绍

构建方式

StayStill数据集基于无标记动作捕捉技术构建，采用4台GoPro Hero 11相机呈半圆形环绕参与者，通过Freemocap软件结合Mediapipe姿态估计框架，利用三角测量法重建三维骨骼动画。数据采集涵盖三个阶段：首先，50名参与者被执行18类预设的静止动作（如搔痒、看表、伸展等），每类动作重复两次以增加多样性；其次，进行2分钟的自然静止状态录制，模拟街头等候情境；最后，录制含手机使用的静止场景。所有数据经手动清洗与标注，剔除异常帧与多动作混合片段，并对齐至30帧/秒的BVH格式，同时重定向至LaFAN1标准的22骨骼结构。

特点

该数据集是目前规模最大的三维静止动画专用数据集，总计约6小时运动数据，包含645,338帧，来自50名年龄跨度22至65岁的非专业受试者，性别比例为70%男性与30%女性。数据划分为三大子集：静止动作（18类，275,751帧）、自然静止（181,846帧）以及含手机静止（187,741帧）。数据集提供官方主题划分的训练-验证-测试集（70%-10%-20%），并附有清洗后的高质量标注，确保每段动画的纯净度与动作标签的准确性。

使用方法

数据集以BVH格式发布，可直接用于训练深度学习模型，支持动作填充与静止动画生成任务。官方提供了基于两阶段Transformer网络的基线模型，以及数值评估（L2位置/旋转损失、NPSS）与用户感知评估（118名参与者配对比较）的标准流程。使用者可加载预训练模型进行自回归生成，通过10帧上下文与45帧目标帧的迭代拼接产生长时间静止动画，并应用后处理算法修正生成过程中的不连续性。代码、评估脚本与用户反馈数据均已开源，便于复现与扩展研究。

背景与挑战

背景概述

StayStill数据集由西班牙巴斯克大学与Electronic Arts Sweden的研究人员于2026年联合创建，旨在填补三维静态动画领域大规模数据资源的空白。尽管虚拟角色的自然静止姿态对于提升沉浸感至关重要，但过往研究多聚焦于动态动作生成，如行走或说话，而忽视了低强度运动的建模，其根源在于缺乏专门的高质量数据集。为攻克此瓶颈，研究团队采集了50名被试在执行自然等待、使用手机及18类典型静止动作时的运动数据，总计约6小时，并提供了标准化的评估协议，为推动深度学习驱动的静态动画生成奠定了坚实基础。

当前挑战

该数据集面临的核心挑战在于解决领域问题与构建过程的双重困难。领域层面，静态动画生成长期被忽视，缺乏像图像分类中ImageNet那样的专用基准，导致难以开展系统的深度学习方法研究，且现有数值指标（如位置误差）与人类感知存在显著偏差，亟需建立以用户研究为核心的标准化评价体系。构建过程中，研究者需在无专业动作捕捉设备的条件下，利用多摄像头与无标记点软件实现高精度三维重建，仍需手动同步、校准并剔除因姿态估计错误或动作混杂导致的瑕疵片段，以确保数据纯净与多样性，这些挑战共同构成了推动静态动画生成技术进步的瓶颈。

常用场景

经典使用场景

在虚拟角色动画与计算机图形学领域，StayStill数据集的核心用途在于训练和评估基于深度学习的静态动画生成模型。研究者可借助该数据集中包含的50名受试者、近6小时的多样化静态动作数据，包括一般性静止、使用手机时的静止以及18类精细静态动作，来构建能够自动生成逼真停驻状态的动画系统。该数据集尤其适用于运动插值任务，因其提供了标准化的训练、验证与测试划分，使得不同模型能够在同一基准上进行公平比较，从而推动了静态动画生成这一长期被忽视的研究方向的发展。

解决学术问题

StayStill数据集的出现解决了虚拟角色动画研究中一个长期存在的学术空白——即缺乏大规模、高质量、三维的静态动作专用数据集。在此之前，静态动作的生成研究极为稀少，主要受限于数据不足，导致无法开展系统的统计分析与深度学习建模。该数据集不仅提供了充足且带有精细标注的训练材料，还首次提出了结合数值指标与用户感知评估的标准化评价协议。这使得研究者能够系统地探索静态动作的动态特性，验证生成模型的真实感，并为未来该领域内不同方法的公平比较奠定了基础。

衍生相关工作

StayStill数据集的发布有望催生一系列相关领域的经典研究工作，类似于LaFAN1数据集对运动插值领域的推动。预期衍生的研究方向包括：基于扩散模型或流匹配的静态动作生成技术、能够控制动作风格与个性化特征的多模态生成框架，以及针对静态动作的感知质量评估与客观指标改进。此外，该数据集还启发了将静态动作与同语音手势生成、运动预测等相邻领域相结合的研究路径，推动构建能够处理多种低强度动态行为的统一生成模型。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集