rdt-ft-data|双机械臂操作数据集|扩散模型数据集
收藏数据集概述
数据集信息
- 名称: RDT-FT-Data
- 许可证: MIT
- 标签:
- robotics
- multimodal
- finetuning
- vla
- rdt
数据集来源
- 项目页面: https://rdt-robotics.github.io/rdt-robotics/
- 论文: https://rdt-robotics.github.io/rdt-robotics/static/paper.pdf
- 代码: https://github.com/thu-ml/RoboticsDiffusionTransformer
- 模型: https://huggingface.co/robotics-diffusion-transformer/rdt-1b
数据集用途
- 下载与解压: 下载所有归档文件并使用以下命令解压: bash cat rdt_data.tar.gz.* | tar -xzvf -
数据结构
-
文件夹结构:
rdt_data/---task_1/---episode_1.hdf5 | | |-task_2/ |-episode_2.hdf5 | | |-task_3/ |-... | | |-... |-expanded_instruction_gpt-4-turbo.json
-
HDF5文件:
observations
:qpos
: 两个机械臂的关节位置,形状为 (TRAJ_LEN, 14);第七和第十四个关节是夹持器关节角度images
:cam_high
: 外部摄像头在每个时间步的RGB图像,形状为 (TRAJ_LEN, 480, 640, 3)cam_left_wrist
: 左腕摄像头在每个时间步的RGB图像,形状为 (TRAJ_LEN, 480, 640, 3)cam_right_wrist
: 右腕摄像头在每个时间步的RGB图像,形状为 (TRAJ_LEN, 480, 640, 3)
action
: 下一个时间步两个机械臂的期望关节位置,形状为 (TRAJ_LEN, 14);注意这与下一个时间步的实际关节位置略有不同
-
JSON文件:
instruction
: 原始的人工标注指令,值为字符串expanded_instruction
: 由GPT-4-Turbo扩展的指令,值为字符串列表simplified_instruction
: 由GPT-4-Turbo简化的指令,值为字符串列表
注意事项
- HDF5文件的数量不一定连续。
TRAJ_LEN
可能因片段而异。

SuMeyYao/ysmpubmedclt
该数据集的许可证为apache-2.0,主要用于表格问答任务,数据集语言为英语,大小介于1亿到10亿之间。
hugging_face 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录
网易云音乐数据集
该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。
github 收录
红外谱图数据库
收集整理红外谱图实验手册等数据,建成了红外谱图数据库。本数据库收录了常见化合物的红外谱图。主要包括化合物数据和对应的红外谱图数据。其中,原始红外谱图都进行了数字化处理,从而使谱峰检索成为可能。用户可以在数据库中检索指定化合物的谱图,也可以提交谱图/谱峰数据,以检索与之相似的谱图数据,以协助进行谱图鉴定。
国家基础学科公共科学数据中心 收录
PlantVillage
在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。
OpenDataLab 收录