drilling_dataset
收藏Hugging Face2026-05-13 更新2026-05-14 收录
下载链接:
https://huggingface.co/datasets/vabbosh2/drilling_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个机器人学数据集,使用LeRobot工具创建并采用Apache-2.0许可证。它包含265个完整的任务序列(episodes),总计8157个数据帧(frames),专注于一个单一任务。数据以Parquet文件格式存储,数据文件大小约为100MB,关联的视频文件大小约为200MB,采样帧率为每秒1帧。整个数据集被划分为训练集,每个数据样本包括多模态观察信息(如分辨率为224x224像素的3通道RGB图像和一个8维浮点数向量状态)和动作指令(一个3维浮点数向量,代表归一化的x轴位移、y轴位移和以度为单位的旋转角度变化)。此外,样本还包含时间戳、帧索引、episode索引、全局索引和任务索引等元数据。该数据集适用于机器人模仿学习、策略学习或视觉-动作映射等研究任务。
This dataset is a robotics dataset created using the LeRobot tool and licensed under Apache-2.0. It contains 265 complete task sequences (episodes) with a total of 8157 data frames, focusing on a single task. The data is stored in Parquet format, with the data files approximately 100MB in size and associated video files around 200MB, sampled at a frame rate of 1 frame per second. The entire dataset is split into a training set. Each data sample includes multimodal observation information (such as 3-channel RGB images with a resolution of 224x224 pixels and an 8-dimensional floating-point vector state) and action instructions (a 3-dimensional floating-point vector representing normalized x-axis displacement, y-axis displacement, and rotation angle change in degrees). Additionally, samples contain metadata like timestamps, frame index, episode index, global index, and task index. The dataset is suitable for research tasks such as robot imitation learning, policy learning, or vision-action mapping.
创建时间:
2026-05-10
原始信息汇总
数据集概述
- 数据集名称: drilling_dataset
- 许可证: Apache-2.0
- 任务类别: 机器人技术 (robotics)
- 标签: LeRobot
数据集描述
该数据集使用 LeRobot 创建,包含机器人钻孔任务的相关数据。
数据集结构
- 代码版本: v3.0
- 机器人类型: 未指定
- 总片段数: 265
- 总帧数: 8157
- 总任务数: 1
- 数据块大小: 1000
- 数据文件大小: 100 MB
- 视频文件大小: 200 MB
- 帧率: 1 FPS
- 数据分割: 训练集包含 0 到 265 片段
数据特征
| 特征名称 | 数据类型 | 形状 | 说明 |
|---|---|---|---|
| observation.image | 图像 | (224, 224, 3) | 尺寸为 224x224 的 3 通道图像 |
| observation.state | float32 | (8,) | 包含 8 个维度的状态数据 |
| action | float32 | (3,) | 包含 3 个动作维度:delta_x_norm, delta_y_norm, delta_angle_deg |
| timestamp | float32 | (1,) | 时间戳 |
| frame_index | int64 | (1,) | 帧索引 |
| episode_index | int64 | (1,) | 片段索引 |
| index | int64 | (1,) | 索引 |
| task_index | int64 | (1,) | 任务索引 |
可视化
可通过 LeRobot 可视化工具查看该数据集:可视化链接
搜集汇总
数据集介绍

构建方式
该数据集基于LeRobot框架构建,专注于机器人加工领域的钻孔操作任务。数据集共包含265个演示片段,累计8157帧时序数据,所有数据均以Parquet格式高效存储于`data/*/*.parquet`路径下。每个片段记录了从初始状态到动作完成的完整过程,通过每秒1帧的低频采样策略,兼顾数据采集效率与关键动作捕捉的完整性。数据集未划分验证集或测试集,全部片段默认作为训练集使用,为模仿学习等算法提供充足的训练样本。
特点
数据集的核心特点在于其多维度的异构数据融合。观测空间包含224×224像素的RGB图像(observation.image)与8维浮点状态向量(observation.state),其中状态向量涵盖机器人关节角度、末端执行器位姿等关键物理量。动作空间为3维连续变量,包括归一化的水平位移增量(delta_x_norm、delta_y_norm)与钻孔角度变化(delta_angle_deg),精准描述钻孔作业的精细操控需求。此外,数据集提供时间戳、帧索引、片段索引等结构化元信息,便于时序建模与多片段联合分析。
使用方法
使用方法遵循LeRobot标准数据加载协议。用户可通过`datasets.load_dataset`函数直接加载,指定配置名为`default`即可自动读取所有Parquet文件。对于图像数据,需使用`decode=True`参数自动解析为PIL图像对象或numpy数组。典型应用流程包括:利用`observation.image`与`observation.state`构建状态编码器,以`action`作为监督信号训练策略网络。由于数据未提供视频路径且片段索引连续,建议按`episode_index`分组进行序列化批处理,适用于端到端模仿学习与离线强化学习算法的训练与评估。
背景与挑战
背景概述
在智能制造与机器人操作领域中,精密钻孔任务因其对空间定位精度与力反馈控制的严苛要求,成为评估机器人灵巧操作能力的重要基准。drilling_dataset由vabbosh2团队于近期基于LeRobot框架创建,致力于为机器人钻孔操作提供标准化的数据支撑。该数据集包含265个训练片段,共计8157帧图像,每帧为224×224像素的视觉观测,配合8维状态空间与3维动作空间(涵盖归一化位移与角度控制),记录了机器人从初始状态到完成钻孔的完整动作轨迹。作为公开的Apache-2.0许可数据集,它填补了机器人精细操作领域钻孔专用数据集的空白,为模仿学习与强化学习等算法提供了可复现的基准测试场景,推动了机器人技能学习从学术研究向工业应用的转化。
当前挑战
该数据集应对的核心领域挑战在于:钻孔任务需同时处理视觉引导的精确空间定位与接触式操作的动态力调控,传统端到端方法常因动作维度高、接触状态复杂而难以泛化。构建过程中,记录频率仅1帧/秒,难以捕捉高速钻孔中的瞬态形变与震动反馈;动作空间虽简化为3维,但未包含力矩或力传感器数据,限制了接触力感知策略的学习。此外,数据集仅含单一任务类型且无环境多样性(如不同板材材质),导致模型易过拟合于特定工况。缺乏同步视频数据与动作序列的时间关联性分析,也增加了对时序依赖关系建模的难度。这些限制共同构成了从数据采集到模型部署的关键瓶颈。
常用场景
经典使用场景
在机器人操作与自动化领域,钻孔数据集(drilling_dataset)是针对精密装配与工业加工场景构建的专用资源。该数据集包含265个演示回合、共计8157帧数据,通过高分辨率视觉图像(224x224像素)与八维状态向量记录机械臂的实时观测信息,同时以三维归一化动作空间(包括平面位移与角度变化)作为控制指令。典型应用场景聚焦于模仿学习范式,研究者可利用LeRobot框架将专家演示中的视觉-状态序列映射至动作策略,训练机器人完成高精度钻孔任务,尤其适用于场景中工件位置变化或夹具刚度存在差异的泛化教学。
实际应用
在实际工业场景中,该数据集所训练的模型可部署于柔性制造单元,实现PCBA电路板钻孔、铝合金型材定位打孔或复合材料叠层钻孔等工序的自动化。通过融合LeRobot生态的实时推理能力,系统能够根据视觉反馈动态调整末端执行器的进给速度与旋转角度,减少因材料形变或夹具松动导致的孔径偏差。此外,数据集中的观测状态包含关节角度与末端力信息,可用于监控刀具磨损状态并预测维护周期,从而在航空结构件装配或汽车零部件生产线中降低次品率与停机时间。
衍生相关工作
围绕drilling_dataset已衍生出多项推动机器人学习发展的创新工作。例如,基于该数据集的特征工程开拓了视觉-语言-动作联合建模的早期尝试,利用自然语言描述的钻孔任务属性(如‘在蓝漆表面垂直钻孔’)生成上下文关联的策略。另有研究者据此开发了轻量级残差策略网络,在保持原始动作精度的同时将参数量压缩至传统方案的30%,适用于计算资源受限的边缘控制器。此外,该数据集常被用作域随机化迁移学习的基线资源,通过对比仿真数据与真实钻孔演示的分布差异,验证了从合成数据到实物部署中隐式表示解耦的有效性,从而启发了后续关于微调Transformer策略以适应不同夹具极性配置的探索。
以上内容由遇见数据集搜集并总结生成



