siyulw2025/aic-data-sub-v2

Name: siyulw2025/aic-data-sub-v2
Creator: siyulw2025
Published: 2026-04-30 15:49:46
License: 暂无描述

Hugging Face2026-04-30 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/siyulw2025/aic-data-sub-v2

下载链接

链接失效反馈

官方服务：

资源简介：

--- tags: - aic - robot - cable-insertion - xvla --- # AIC Data Subsampled v2 Subsampled version of the original 180-episode training data. Stationary settle frames (P3 tail) were removed. ## Subsampling Strategy - Original: 270K frames (53% stationary settle) - Subsampled: 103K frames (P3 trimmed to first 200 frames per episode) - Contiguous cuts only (no gaps in trajectories) ## Stats | Split | Episodes | Frames | |---|---|---| | Train | 162 | 102730 | | Val | 18 | 22472 | | Total | 180 | 125202 | ## Format Standard AIC flat-parquet. Each row: state_0..25, action_0..6, image_path_left/center/right_camera, episode_id, frame_index, timestamp. ## Usage Point training scripts to train_meta_sub2.json.

AIC Data Subsampled v2 is a subsampled version of the original 180-episode training data with stationary settle frames (P3 tail) removed. The subsampling strategy includes: original data has 270K frames (53% stationary settle), subsampled data has 103K frames (P3 trimmed to first 200 frames per episode), and only contiguous cuts are kept (no gaps in trajectories). Statistics are divided into training set (162 episodes, 102730 frames), validation set (18 episodes, 22472 frames), and total (180 episodes, 125202 frames). The data format is standard AIC flat-parquet, each row contains state_0..25, action_0..6, image_path_left/center/right_camera, episode_id, frame_index, and timestamp. Usage involves pointing training scripts to train_meta_sub2.json.

提供机构：

siyulw2025

搜集汇总

数据集介绍

构建方式

该数据集来源于原始的180个插线机器人操作回合的演示数据，经过精细的子采样处理而成。构建过程中，移除了机器人静止状态下的稳定帧（P3尾部），仅保留每个回合的前200帧作为动态操作片段。子采样策略采用连续切割方式，确保轨迹的完整性与连贯性，避免了数据间存在不连续间隙。最终，训练集包含162个回合、102730帧，验证集包含18个回合、22472帧，总计125202帧数据，较原始270K帧数据大幅缩减了冗余的静态信息。

特点

数据集具有鲜明的针对性，专注于机器人插线任务的视觉-语言-动作联合学习。其最大特点在于高效压缩，通过剔除约53%的静止帧，显著提升了动态帧的密度与训练效率。数据以标准化AIC平面Parquet格式存储，每行包含25维状态向量、7维动作向量、三视角图像路径（左、中、右相机），以及回合编号、帧索引和时间戳等结构化信息，为多模态模型训练提供了完整而紧凑的输入支持。

使用方法

使用方法简洁直观，主要用于驱动基于视觉和语言的机器人操作模型训练。用户可依据提供的`train_meta_sub2.json`元文件直接指向训练脚本，无需额外处理。数据格式兼容标准AIC流水线，可直接加载flat-parquet文件进行批次读取。适合研究者在XVLA等架构下开展模仿学习或强化学习实验，通过多视角图像与状态动作的对应关系，探索机器人精细操作技能的高效迁移与泛化。

背景与挑战

背景概述

在机器人操作领域，精确的线束插入任务因其高精度要求和复杂接触动力学而成为研究热点。AIC数据子采样第二版（aic-data-sub-v2）由相关机器人研究团队于近期创建，旨在为视觉-语言-动作模型（XVLA）提供高效的训练数据集。该数据集源自原始的180个演示片段，通过剔除约53%的静态稳定帧（P3尾部），将帧数从27万压缩至10.3万，同时保持轨迹的连续完整性。这一精简版本显著降低了模型训练的计算资源需求，为多模态机器人操作学习提供了基准数据支持，推动了数据效率与任务迁移性的研究。

当前挑战

该数据集所解决的领域挑战主要在于：其一，机器人线束插入任务对动作精度和状态感知要求极高，原始高冗余数据会引入大量无效监督信号，影响模型对关键动态变化的敏感性；其二，构建过程中面临如何保留有效接触动力学信息的同时剔除无信息静止帧的问题，仅对P3阶段进行前200帧截断，需确保不破坏演示的因果连续性；此外，还需协调多视角图像（左、中、右相机）与26维状态、7维动作的时空对齐，以避免数据异构性导致的模型训练偏差。

常用场景

经典使用场景

在机器人操作与精细操控领域，该数据集为研究缆线精准插入这一典型任务提供了高质量的基准数据。由于缆线插入涉及柔性物体形变、微小间隙对准及接触力控制等复杂挑战，aic-data-sub-v2数据集通过保留关键动态帧并剔除静止等待帧，使得模型能够专注于学习从接近到插入成功的完整移动轨迹。该数据集常被用于训练和评估基于视觉与状态观测的模仿学习算法，特别适用于需要连续动作序列预测的场景，如利用行为克隆或隐式策略网络来复现操作技能。

实际应用

在实际工业与机器人应用场景中，该数据集蕴含的缆线插入技能可直接迁移至工厂自动化装配线，例如电子元件接线、汽车线束连接等依赖毫米级精度的操作环节。基于此数据集训练的机器人控制器，能够利用三视角视觉输入（左、中、右相机）与多维度力位状态反馈，在动态环境中实现实时的适应性插入。此外，该数据集的扁平化Parquet格式降低了工程部署门槛，使得研究人员能够快速将训练策略集成至现有机器人操作系统（ROS）中，从而加速从数据采集到生产部署的全流程闭环。

衍生相关工作

该数据集衍生了一系列创新性研究工作，推动了精细操控领域的发展。基于此数据子采样策略，研究者提出了自适应帧筛选方法来优化模仿学习中的样本利用率。围绕缆线插入任务，后续工作探索了结合变分推断的隐式动作空间建模、融合接触力信息的残差策略学习，以及利用多视角一致性约束增强视觉表征泛化能力等方法。此外，该数据集还被用作跨任务泛化测试的基准，验证了在大语言模型引导下的机器人学习框架（如XVLA）中，预训练视觉编码器对新型插入场景的零样本适应能力。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集