k-matsushima/record-test
收藏Hugging Face2026-04-11 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/k-matsushima/record-test
下载链接
链接失效反馈官方服务:
资源简介:
---
license: apache-2.0
task_categories:
- robotics
tags:
- LeRobot
configs:
- config_name: default
data_files: data/*/*.parquet
---
This dataset was created using [LeRobot](https://github.com/huggingface/lerobot).
<a class="flex" href="https://huggingface.co/spaces/lerobot/visualize_dataset?path=k-matsushima/record-test">
<img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl.svg"/>
<img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl-dark.svg"/>
</a>
## Dataset Description
- **Homepage:** [More Information Needed]
- **Paper:** [More Information Needed]
- **License:** apache-2.0
## Dataset Structure
[meta/info.json](meta/info.json):
```json
{
"codebase_version": "v3.0",
"robot_type": "so_follower",
"total_episodes": 1,
"total_frames": 184,
"total_tasks": 1,
"chunks_size": 1000,
"data_files_size_in_mb": 100,
"video_files_size_in_mb": 200,
"fps": 30,
"splits": {
"train": "0:1"
},
"data_path": "data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet",
"video_path": "videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4",
"features": {
"action": {
"dtype": "float32",
"names": [
"shoulder_pan.pos",
"shoulder_lift.pos",
"elbow_flex.pos",
"wrist_flex.pos",
"wrist_roll.pos",
"gripper.pos"
],
"shape": [
6
]
},
"observation.state": {
"dtype": "float32",
"names": [
"shoulder_pan.pos",
"shoulder_lift.pos",
"elbow_flex.pos",
"wrist_flex.pos",
"wrist_roll.pos",
"gripper.pos"
],
"shape": [
6
]
},
"observation.images.front": {
"dtype": "video",
"shape": [
480,
640,
3
],
"names": [
"height",
"width",
"channels"
],
"info": {
"video.height": 480,
"video.width": 640,
"video.codec": "av1",
"video.pix_fmt": "yuv420p",
"video.is_depth_map": false,
"video.fps": 30,
"video.channels": 3,
"has_audio": false
}
},
"observation.images.wrist": {
"dtype": "video",
"shape": [
480,
640,
3
],
"names": [
"height",
"width",
"channels"
],
"info": {
"video.height": 480,
"video.width": 640,
"video.codec": "av1",
"video.pix_fmt": "yuv420p",
"video.is_depth_map": false,
"video.fps": 30,
"video.channels": 3,
"has_audio": false
}
},
"timestamp": {
"dtype": "float32",
"shape": [
1
],
"names": null
},
"frame_index": {
"dtype": "int64",
"shape": [
1
],
"names": null
},
"episode_index": {
"dtype": "int64",
"shape": [
1
],
"names": null
},
"index": {
"dtype": "int64",
"shape": [
1
],
"names": null
},
"task_index": {
"dtype": "int64",
"shape": [
1
],
"names": null
}
}
}
```
## Citation
**BibTeX:**
```bibtex
[More Information Needed]
```
提供机构:
k-matsushima
搜集汇总
数据集介绍

构建方式
在机器人学习领域,高质量的数据集是算法训练与评估的基石。record-test数据集依托LeRobot平台构建,通过采集真实机器人操作过程中的多模态数据形成结构化记录。该数据集采用分块存储策略,将数据组织为Parquet格式文件,并同步保存了对应的视频流。数据采集以固定帧率进行,确保了时序信息的一致性,同时通过索引字段维护了数据间的关联关系,为后续分析提供了可靠的数据基础。
特点
该数据集展现了机器人操作任务中典型的多模态特性,融合了关节状态观测与视觉感知信息。其核心特征在于同时包含六自由度机械臂的动作指令、关节位置状态以及双视角视觉输入,形成了完整的感知-动作闭环。数据以高帧率视频流形式保存,保留了操作过程的动态细节,而统一的数据结构设计使得不同模态信息能够精确对齐,为模仿学习与强化学习算法提供了丰富的训练素材。
使用方法
研究人员可通过标准数据加载接口访问该数据集,利用其预定义的数据分割方案进行模型训练与验证。数据集采用分块存储机制,支持流式读取以处理大规模序列数据。在使用过程中,用户可依据任务需求提取特定模态的特征,如关节状态序列或视觉观察帧,并通过时间戳与帧索引实现多源数据的同步。该数据集的结构化设计使其能够无缝集成至主流机器人学习框架,为算法开发提供便捷的数据支持。
背景与挑战
背景概述
在机器人学习领域,模仿学习与强化学习的发展亟需高质量、多模态的真实世界交互数据作为支撑。record-test数据集由LeRobot项目创建,该项目隶属于HuggingFace生态系统,致力于推动开源机器人学习研究。该数据集聚焦于机器人操作任务,具体针对so_follower型机器人,记录了包含关节位置、前视与腕部视觉观测等多维度的时序交互数据。其核心研究问题在于如何通过真实环境下的演示数据,有效训练机器人执行复杂的连续控制任务,从而推动具身智能在非结构化环境中的泛化能力与适应性。尽管数据集规模相对有限,但其结构化的特征设计与开源许可为社区提供了可扩展的数据范式,对机器人学习算法的实证评估与迭代优化具有基础性价值。
当前挑战
record-test数据集所针对的机器人操作任务,其核心挑战在于高维连续动作空间与复杂视觉观测的联合建模,以及从有限演示中学习稳健且泛化的策略。具体而言,机器人需在动态环境中基于多视角图像输入,精确控制多个关节执行抓取或跟随等精细操作,这对算法的感知-动作耦合能力提出了严峻考验。在数据构建层面,挑战主要体现于真实世界数据的采集与标注:机器人硬件平台的校准误差、传感器噪声以及环境光照变化均会引入数据不一致性;同时,大规模、高质量演示数据的收集成本高昂,且需要确保任务覆盖的多样性与安全性。此外,多模态数据(如视频与状态)的同步存储与高效管理,也是工程实现中需克服的技术难点。
常用场景
经典使用场景
在机器人学领域,record-test数据集为模仿学习与强化学习算法的验证提供了关键支持。该数据集通过记录机械臂在特定任务中的状态、动作及视觉观测数据,构建了多模态交互序列,典型应用于训练端到端的机器人控制策略。研究人员可利用其包含的前置与腕部摄像头视频流,结合关节位置信息,模拟真实环境下的决策过程,从而评估算法在动态场景中的泛化能力与鲁棒性。
解决学术问题
该数据集有效应对了机器人控制研究中数据稀缺与仿真-现实差距的挑战。通过提供真实机械臂的交互记录,它支持了离线强化学习、行为克隆等方法的实证分析,促进了算法在样本效率与安全约束方面的优化。其结构化多模态特征有助于探索状态表示学习与跨模态对齐问题,为机器人自主技能习得奠定了数据基础,推动了数据驱动范式的学术进展。
衍生相关工作
围绕record-test数据集,衍生出诸多机器人学习领域的经典研究。例如,基于其多模态序列的时空建模工作,促进了视频预测与规划算法的融合;同时,该数据集常作为基准,用于评估模仿学习框架如BC-Z或决策Transformer的性能。此外,结合LeRobot平台的开源生态,进一步催生了模块化策略学习与跨任务迁移方法,丰富了机器人数据驱动的学术谱系。
以上内容由遇见数据集搜集并总结生成



