Actor-18M
收藏github2026-03-16 更新2026-03-18 收录
下载链接:
https://github.com/WildActor/WildActor
下载链接
链接失效反馈官方服务:
资源简介:
Actor-18M是一个大规模人类视频数据集,旨在捕捉无约束视角和环境下的身份一致性。它包含1.6M视频和18M对应的人类图像,涵盖任意视角和标准三视角表示。
Actor-18M is a large-scale human video dataset designed to capture identity consistency under unconstrained viewpoints and environments. It contains 1.6M videos and 18M corresponding human images, covering arbitrary viewpoints and standard tri-view representations.
创建时间:
2026-03-09
原始信息汇总
WildActor 数据集概述
数据集基本信息
- 数据集名称: Actor-18M
- 核心目标: 为在无约束视角和环境下的身份一致性视频生成研究提供数据支持。
- 数据规模: 包含 1.6M 个视频 和 18M 张对应的人体图像。
- 数据内容: 涵盖任意视角和规范的三视角(canonical three-view)表示。
数据集关联研究
- 关联论文: 《WildActor: Unconstrained Identity-Preserving Video Generation》
- 关联项目: WildActor 框架,一个用于任意视角条件人体视频生成的框架。
- 技术贡献: 该数据集旨在解决现有方法在保持数字演员全身身份一致性(跨动态镜头、视角和动作)方面的挑战。
数据集状态与获取
- 发布状态: 代码和数据将在基础模型发布后公开。
- 数据集地址: https://github.com/WildActor/WildActor/tree/main/Actor-18M
- 论文地址: https://arxiv.org/abs/2603.00586
- 项目主页: https://wildactor.github.io/
评估基准
- 评估基准: Actor-Bench。在该基准上评估的 WildActor 框架能够在多样的镜头构图、大的视角转换和显著运动中持续保持全身身份一致性。
搜集汇总
数据集介绍

构建方式
在计算机视觉与生成式人工智能领域,构建能够支撑身份一致性视频生成的数据集面临巨大挑战。Actor-18M数据集的构建旨在捕捉无约束视角与环境下的身份一致性,其核心方法是通过大规模采集与结构化处理,汇集了总计160万段视频及其对应的1800万张人体图像。该过程不仅涵盖了任意视角的自然场景,还精心构建了标准化的三视角表征,为模型学习复杂的人体身份与动态提供了多维度、高覆盖度的原始素材。这种构建方式为后续的身份保持生成任务奠定了坚实的数据基础。
特点
Actor-18M数据集的特点在于其规模宏大与内容设计的针对性。该数据集拥有1800万张高质量人体图像,源自160万段视频,其核心优势在于同时包含了任意视角的丰富样本与规范的三视角表示,这为模型理解身份在不同空间变换下的不变性提供了关键信息。数据内容覆盖了多样的拍摄构图、大幅度的视角转换以及显著的人体运动,专门针对现有方法中常见的面部中心化、身体一致性不足以及姿态锁定导致的僵硬伪影等问题进行优化,从而为无约束身份保持视频生成设立了新的基准。
使用方法
该数据集主要服务于训练和评估身份保持的人类视频生成模型,例如与其配套提出的WildActor框架。使用者可通过加载数据集中提供的视频序列与对应图像,训练模型学习在动态镜头、不同视角和复杂运动下维持完整身体身份一致性的能力。具体而言,数据集中的任意视角样本可用于训练模型对未见过视角的泛化能力,而标准三视图则有助于建立稳定的身份先验。研究人员可在此基础上开发新颖的注意力机制与采样策略,以推动高质量数字角色生成技术的发展。
背景与挑战
背景概述
在数字内容创作与人工智能生成领域,保持人物身份一致性是视频合成的核心难题。Actor-18M数据集由研究团队于2026年提出,旨在解决无约束视角与环境下人类视频生成中身份一致性的挑战。该数据集包含160万段视频及对应的1800万张人类图像,覆盖任意视角与标准三视图表示,为训练模型提供了丰富的视觉上下文。其构建推动了身份保持视频生成技术的发展,为电影制作、虚拟现实等应用提供了关键数据支撑,标志着该领域从面部中心化向全身一致性建模的重要转变。
当前挑战
Actor-18M数据集致力于应对身份保持视频生成中的关键挑战,即在动态镜头、大幅视角转换与复杂动作下维持人物全身身份的一致性。传统方法常局限于面部特征,忽视身体层面的连贯性,或产生因姿态锁定导致的僵硬复制粘贴伪影。在数据构建过程中,采集无约束环境下的多视角视频并确保身份标注的准确性构成了显著挑战,需处理大规模视频数据的对齐、去噪与标准化,以支撑模型学习鲁棒的身份表示。
常用场景
经典使用场景
在计算机视觉与生成式人工智能领域,Actor-18M数据集为无约束条件下身份保持的视频生成研究提供了关键支撑。该数据集通过涵盖大量多视角、动态环境的人类视频与图像,典型应用于训练和评估模型在复杂场景中维持人物全身身份一致性的能力。研究者可借助其丰富的视角变化与运动序列,探索生成视频中人物外观、姿态及环境的自然连贯性,推动数字角色生成技术向影视级质量迈进。
解决学术问题
Actor-18M数据集致力于解决生成式模型中身份一致性保持的学术难题,特别是在动态视角与复杂运动下全身身份特征的稳定呈现。传统方法常局限于面部中心化或产生姿态锁定的复制粘贴伪影,而该数据集通过提供大规模多视角标注数据,支持模型学习更全面的身份表征,从而在学术上促进了无约束视频生成中身份保持机制的创新,为评估生成质量设立了新的基准。
衍生相关工作
围绕Actor-18M数据集,已衍生出如WildActor框架等一系列经典研究工作。这些工作引入了非对称身份保持注意力机制与视角自适应蒙特卡洛采样策略,显著提升了模型在无约束条件下的生成性能。相关研究不仅推动了身份保持视频生成技术的进步,还促进了多模态生成模型、动态视角合成等交叉方向的发展,为后续学术探索提供了坚实的数据与方法基础。
以上内容由遇见数据集搜集并总结生成



