five

InternData-A1

收藏
arXiv2025-11-21 更新2025-11-22 收录
下载链接:
https://arxiv.org/abs/2511.16651v1
下载链接
链接失效反馈
官方服务:
资源简介:
InternData-A1是由上海人工智能实验室与北京大学联合创建的高保真合成机器人操作数据集,旨在推动具身智能研究。该数据集规模宏大,包含63万条轨迹、7433小时操作时长,覆盖4种机器人构型、18种技能类型、70项任务和227个场景,涉及刚性、关节式、可变形及流体物体的多样化交互。数据集通过全自动解耦式仿真流程生成,整合了资产库检索、技能策略组合与物理渲染技术,有效支持双手操作与多阶段任务。其核心应用在于为视觉-语言-动作模型提供大规模预训练数据,显著降低仿真到现实的迁移差距,并解决机器人泛化能力不足的关键挑战。

InternData-A1 is a high-fidelity synthetic robotic manipulation dataset jointly created by the Shanghai AI Laboratory and Peking University, aiming to advance embodied intelligence research. With a massive scale, this dataset encompasses 630,000 trajectories, 7,433 hours of manipulation duration, covers 4 robotic configurations, 18 skill types, 70 tasks and 227 scenarios, and involves diverse interactions with rigid, articulated, deformable and fluid objects. Generated via a fully automatic decoupled simulation pipeline, the dataset integrates asset library retrieval, skill-policy combination and physics rendering technologies, effectively supporting dual-arm manipulation and multi-stage tasks. Its core application is to provide large-scale pre-training data for vision-language-action models, significantly narrowing the sim-to-real transfer gap and addressing the critical challenge of insufficient robotic generalization capability.
提供机构:
上海人工智能实验室、北京大学
创建时间:
2025-11-21
原始信息汇总

InternData-A1 数据集概述

基本信息

  • 数据集名称: InternData-A1
  • arXiv标识符: arXiv:2511.16651v1
  • 提交日期: 2025年11月20日
  • 研究领域: 机器人学 (Robotics)

数据集描述

InternData-A1是一个用于预训练通用策略的高保真合成数据集,包含超过63万条轨迹和7,433小时的数据,涵盖4种机器人形态、18种技能、70项任务和227个场景,涉及刚性、关节型、可变形和流体物体操作。

技术特点

  • 通过高度自主、完全解耦和组合式仿真流程生成
  • 支持长时程技能组合、灵活任务组装和异构机器人形态
  • 最小化人工调参需求

性能表现

  • 使用与π₀相同的架构,在InternData-A1上预训练的模型性能与官方π₀相当
  • 在49个仿真任务、5个真实世界任务和4个长时程灵巧操作任务中表现匹配
  • 展现出惊人的零样本仿真到现实迁移能力

可用性

  • 数据集将公开发布
  • 生成管道将开源
  • 旨在扩大大规模机器人数据的可访问性,降低具身AI研究的数据创建门槛

相关资源

  • 论文PDF: https://arxiv.org/pdf/2511.16651v1
  • DOI: https://doi.org/10.48550/arXiv.2511.16651
搜集汇总
数据集介绍
main_image_url
构建方式
在具身智能研究领域,大规模高质量数据集的构建始终面临现实世界采集成本高昂的挑战。InternData-A1通过高度自主的解耦式仿真流水线实现了数据生成,该流水线将资产规范、技能策略、任务组合与渲染过程完全分离。研究人员从资产库中检索机械臂本体、场景与物体,通过组合预设的脚本化技能策略生成完整行为轨迹。这种组合式设计支持双手操作、多机器人协作与多阶段长时程任务,同时自动生成物体级标注、领域随机化与碰撞感知运动规划。经过框架优化,该流水线在8张RTX 4090 GPU上每日可产出209.7小时机器人数据,单次交互成本低于0.003美元,实现了物理与视觉高保真演示的高效合成。
特点
作为视觉-语言-动作模型预训练领域的重要突破,InternData-A1展现出前所未有的规模与多样性特征。该数据集包含63万条轨迹与7433小时交互数据,覆盖4种机械臂本体、18种核心技能、70项具体任务与227个场景,全面涵盖刚性物体、关节物体、可变形物体与流体操控四大领域。其独特价值体现在对长时程技能组合的完整支持,包括至少包含三个连续技能的18项复杂任务,共计12.4万条轨迹。通过精心设计的任务平衡策略,70项任务中56项包含1000至10000条轨迹,形成接近均匀的分布格局,为模型提供了丰富且均衡的学习样本。
使用方法
在机器人学习实践中,InternData-A1为视觉-语言-动作模型的预训练提供了标准化解决方案。研究人员可直接采用与π0模型相同的架构,使用Paligemma视觉语言模型与基于流匹配的动作专家组件,在纯合成数据上进行端到端训练。数据集采用标准LeRobot格式存储,包含物体元数据、语言指令、多视角RGB图像、相机参数以及机器人本体感知状态与动作控制标签。用户可通过简单配置选项记录深度图、 grounding标注与边界框等附加信息。实验表明,仅使用InternData-A1预训练的模型在49项仿真任务、5项现实任务与4项灵巧操作任务中均达到与最强真实数据集相媲美的性能,验证了其作为预训练数据源的卓越有效性。
背景与挑战
背景概述
InternData-A1由上海人工智能实验室与北京大学于2025年联合推出,致力于解决具身智能领域大规模真实机器人数据采集成本高昂的瓶颈。该数据集通过高度自主的仿真流水线生成超过63万条轨迹,涵盖4种机器人形态、18种核心技能和70类任务场景,首次验证了纯合成数据在视觉-语言-动作模型预训练中能达到顶尖真实数据集的性能水平,为机器人学习研究提供了可扩展的数据基础。
当前挑战
该数据集需应对机器人操作任务中动态物体交互、多技能组合等复杂场景的建模挑战,其构建过程需克服仿真与现实间的物理动态差异。通过解耦式流水线架构与多层次系统优化,实现了长时程任务合成与跨形态数据生成,但高度灵巧操作任务的仿真精度仍是持续探索的方向。
常用场景
经典使用场景
在具身智能研究领域,InternData-A1数据集主要应用于视觉-语言-动作模型的预训练过程。该数据集通过高度自主的仿真流水线生成了超过63万条轨迹和7433小时的交互数据,覆盖4种机器人形态、18种技能、70项任务和227个场景。研究人员利用这些数据训练通用策略模型,使其在模拟环境和真实世界任务中展现出卓越的泛化能力,特别是在刚性物体、铰接物体、可变形物体和流体操作等复杂场景中表现优异。
实际应用
该数据集在实际机器人部署中展现出强大的应用价值。基于InternData-A1预训练的模型在49项模拟任务、5项真实世界任务和4项长时序灵巧操作任务中均达到与顶尖模型相当的性能。特别值得注意的是,在十个精选模拟任务中实现了平均成功率超过50%的零样本仿真到现实迁移,其中基础技能任务仅需200个仿真样本即可匹配200个真实样本的性能,为工业自动化、家庭服务机器人等实际应用场景提供了高效解决方案。
衍生相关工作
InternData-A1的发布催生了一系列重要的衍生研究工作。基于该数据集,研究社区开发了多个先进的VLA模型架构和训练方法,推动了仿真到现实迁移技术的突破性进展。数据集采用的解耦式组合仿真流水线为后续大规模合成数据生成提供了技术范本,启发了包括多机器人协同操作、长时序任务规划等方向的新探索。这些工作共同构成了具身智能研究的重要技术基石,持续推动着机器人学习领域的创新发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作