SafeMoVAE-29K

Name: SafeMoVAE-29K
Creator: 澳大利亚国立大学; 北京大学
Published: 2026-01-02 14:31:52
License: 暂无描述

arXiv2026-01-02 更新2026-01-06 收录

下载链接：

https://github.com/AIGeeksGroup/SafeMo

下载链接

链接失效反馈

官方服务：

资源简介：

SafeMoVAE-29K是由澳大利亚国立大学和北京大学联合构建的首个安全文本-动作数据集，基于HumanML3D原始数据通过LLM代理重写安全文本提示并生成精细化动作。该数据集包含29,000条连续空间动作数据（含离散版本），通过MotionFlow Transformer和MotionAgent双模型生成，覆盖日常动作与重写后的安全动作样本。其创新性体现在采用分类-改写策略替代传统关键词过滤，有效解决语义扭曲问题，适用于可信赖动作生成模型的训练与评估，特别针对消除暴力、犯罪等有害意图的文本-动作对齐任务。

SafeMoVAE-29K is the first safe text-to-action dataset jointly developed by The Australian National University and Peking University. Based on the original HumanML3D dataset, it rewrites safe text prompts and generates refined motions via LLM agents. This dataset contains 29,000 samples of continuous spatial motion data (including discrete versions), which are generated by two models, MotionFlow Transformer and MotionAgent, covering both daily motions and rewritten safe motion samples. Its core innovation lies in adopting a classification-rewriting strategy instead of traditional keyword filtering, which effectively addresses the issue of semantic distortion. This dataset is applicable to the training and evaluation of trustworthy motion generation models, particularly for text-to-action alignment tasks that eliminate harmful intentions such as violence and criminal acts.

提供机构：

澳大利亚国立大学; 北京大学

创建时间：

2026-01-02

搜集汇总

数据集介绍

构建方式

在文本驱动动作生成领域，数据安全性与伦理对齐日益受到关注。SafeMoVAE-29K数据集的构建基于HumanML3D基准，通过创新的SafeMoEngine流程实现。该流程首先利用基于大语言模型的智能体对原始文本描述进行三级分类与语义改写，将涉及暴力或有害意图的描述转化为积极安全的表达。随后，采用连续空间生成模型与离散令牌生成模型并行生成对应的安全动作序列，最终整合为包含29,000个样本的数据集，其中既保留了原始安全数据，也提供了经过精细重构的安全文本-动作对。

使用方法

SafeMoVAE-29K主要应用于安全动作生成与机器遗忘研究领域。研究者可利用该数据集训练或评估文本到动作生成模型的安全性能，特别是在有害意图抑制与良性任务保持的平衡方面。数据集支持连续空间与离散令牌两种范式，适用于不同架构的生成模型验证。在实际使用中，可将数据集划分为安全集与遗忘集，分别用于模型效用保持能力评估与有害行为消除效果测试，为可信人工智能研究提供标准化基准。

背景与挑战

背景概述

在文本到动作生成领域，随着扩散模型在动作合成中展现出卓越的真实性与对齐能力，其安全性问题逐渐凸显。现有数据集如HumanML3D和Motion-X虽支持大规模训练，却天然包含暴力、攻击等有害意图的动作描述与序列，这为可信赖的动作生成带来了潜在风险。为应对这一挑战，澳大利亚国立大学与北京大学的研究团队于2026年提出了SafeMoVAE-29K数据集，作为首个专注于安全性的文本到动作数据集。该数据集基于HumanML3D构建，通过大语言模型代理对有害文本描述进行细粒度重写，并利用连续空间生成模型合成对应的安全动作序列，旨在为机器遗忘等安全驱动学习任务提供可靠基准，推动可信赖动作生成研究的发展。

当前挑战

SafeMoVAE-29K数据集致力于解决文本到动作生成中的安全性挑战，其核心在于消除模型对有害动作模式的记忆与生成能力。然而，这一领域面临多重挑战：首先，在离散编码本空间中进行的传统遗忘方法存在代码本耦合问题，替换被良性提示重用的编码条目会导致日常任务性能漂移，同时量化损失会引入动作断层与抖动；其次，现有数据集中有害内容与良性内容混杂，缺乏专门针对安全性的高质量数据，使得模型难以在保留实用性的同时有效遗忘有害行为。数据构建过程中，需克服文本重写的语义保真度与覆盖范围难题，避免基于关键词的简单修剪导致的语义扭曲，并确保生成动作在连续空间中的运动学平滑性与自然过渡。

常用场景

经典使用场景

在文本驱动的人体运动生成领域，SafeMoVAE-29K数据集作为首个专注于安全性的文本-运动配对数据集，其经典使用场景在于为可信赖的运动生成模型提供训练与评估基准。该数据集通过精细重构的文本描述与对应的安全运动序列，为研究者构建了一个无有害语义污染的标准化环境，使得模型能够在连续潜在空间中学习生成符合伦理规范的人体动作。其应用贯穿于运动生成模型的安全性微调、机器遗忘策略的验证以及跨模态对齐任务的性能测评，为推进负责任的人工智能发展奠定了数据基础。

解决学术问题

SafeMoVAE-29K数据集主要解决了文本到运动生成中存在的安全漏洞与伦理风险问题。传统数据集如HumanML3D和Motion-X天然包含暴力、攻击等有害意图的文本描述及对应运动，导致训练模型可能记忆并生成不当内容。该数据集通过基于大语言代理的文本重写与运动重构，消除了原始数据中的毒性语义，为机器遗忘研究提供了纯净的负样本来源。其意义在于首次将安全性作为核心考量引入运动生成领域，推动了模型在连续空间中进行选择性知识遗忘的技术发展，并在安全性与效用之间实现了更优的权衡。

实际应用

在实际应用层面，SafeMoVAE-29K数据集为构建安全可靠的人机交互系统提供了关键支持。在虚拟现实、游戏角色动画、机器人动作规划等场景中，该数据集能够训练出避免生成暴力或攻击性动作的生成模型，确保输出内容符合社会规范与法律法规。例如，在教育培训或医疗康复的虚拟仿真中，系统可基于该数据集生成温和、友好的指导性动作，避免因模型偏差产生误导或伤害。此外，该数据集也为内容审核与安全过滤机制提供了评估基准，助力开发者在部署前检测并消除潜在风险。

数据集最近研究