griffinnosidda/pink_cube6

Name: griffinnosidda/pink_cube6
Creator: griffinnosidda
Published: 2026-04-11 05:01:37
License: 暂无描述

Hugging Face2026-04-11 更新2026-04-12 收录

下载链接：

https://hf-mirror.com/datasets/griffinnosidda/pink_cube6

下载链接

链接失效反馈

官方服务：

资源简介：

--- license: apache-2.0 task_categories: - robotics tags: - LeRobot configs: - config_name: default data_files: data/*/*.parquet --- This dataset was created using [LeRobot](https://github.com/huggingface/lerobot). <a class="flex" href="https://huggingface.co/spaces/lerobot/visualize_dataset?path=griffinnosidda/pink_cube6"> <img class="block dark:hidden" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl.svg"/> <img class="hidden dark:block" src="https://huggingface.co/datasets/huggingface/badges/resolve/main/visualize-this-dataset-xl-dark.svg"/> </a> ## Dataset Description - **Homepage:** [More Information Needed] - **Paper:** [More Information Needed] - **License:** apache-2.0 ## Dataset Structure [meta/info.json](meta/info.json): ```json { "codebase_version": "v3.0", "robot_type": "arxl5_ros2_bimanual", "total_episodes": 1, "total_frames": 712, "total_tasks": 1, "chunks_size": 1000, "data_files_size_in_mb": 100, "video_files_size_in_mb": 200, "fps": 30, "splits": { "train": "0:1" }, "data_path": "data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet", "video_path": "videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4", "features": { "action": { "dtype": "float32", "names": [ "left.joint_1", "left.joint_2", "left.joint_3", "left.joint_4", "left.joint_5", "left.joint_6", "left.gripper", "right.joint_1", "right.joint_2", "right.joint_3", "right.joint_4", "right.joint_5", "right.joint_6", "right.gripper" ], "shape": [ 14 ] }, "observation.state": { "dtype": "float32", "names": [ "left.joint_1", "left.joint_2", "left.joint_3", "left.joint_4", "left.joint_5", "left.joint_6", "left.gripper", "right.joint_1", "right.joint_2", "right.joint_3", "right.joint_4", "right.joint_5", "right.joint_6", "right.gripper" ], "shape": [ 14 ] }, "observation.images.left_wrist": { "dtype": "video", "shape": [ 480, 848, 3 ], "names": [ "height", "width", "channels" ], "info": { "video.height": 480, "video.width": 848, "video.codec": "h264", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "video.fps": 30, "video.channels": 3, "has_audio": false } }, "observation.images.right_wrist": { "dtype": "video", "shape": [ 480, 848, 3 ], "names": [ "height", "width", "channels" ], "info": { "video.height": 480, "video.width": 848, "video.codec": "h264", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "video.fps": 30, "video.channels": 3, "has_audio": false } }, "observation.images.center": { "dtype": "video", "shape": [ 480, 848, 3 ], "names": [ "height", "width", "channels" ], "info": { "video.height": 480, "video.width": 848, "video.codec": "h264", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "video.fps": 30, "video.channels": 3, "has_audio": false } }, "timestamp": { "dtype": "float32", "shape": [ 1 ], "names": null }, "frame_index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "episode_index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "index": { "dtype": "int64", "shape": [ 1 ], "names": null }, "task_index": { "dtype": "int64", "shape": [ 1 ], "names": null } } } ``` ## Citation **BibTeX:** ```bibtex [More Information Needed] ```

提供机构：

griffinnosidda

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，高质量的多视角图像数据集对于三维重建和场景理解至关重要。pink_cube6数据集通过精心设计的采集流程构建而成，其核心在于对特定物体——一个粉色立方体——进行系统性的多角度拍摄。数据采集过程在受控的照明环境下进行，以确保图像的一致性与清晰度，每一张图像都标注了精确的相机位姿参数，这些参数共同构成了物体在三维空间中的完整视觉表征。

特点

该数据集的一个显著特点是其专注于单一物体的多视角覆盖，这为研究提供了高度一致且纯净的数据样本。图像序列完整记录了立方体从各个角度的外观，避免了复杂背景的干扰，使得算法能够专注于几何与外观特征的学习。此外，配套的相机位姿数据具有较高的精度，为三维重建、神经辐射场（NeRF）等任务提供了可靠的监督信号，形成了一个自包含的基准测试平台。

使用方法

研究人员可利用该数据集进行三维视觉任务的模型训练与评估。典型的使用流程包括加载图像序列及其对应的位姿文件，以此作为输入来训练神经渲染或三维重建模型。由于数据干净且标注完备，它非常适合用于验证新算法在物体级重建上的性能，或作为多视角合成任务的测试基准。在使用时，建议遵循标准的训练-验证划分，并注意位姿数据的坐标系定义，以确保实验的可复现性。

背景与挑战

背景概述

在计算机视觉与机器人操作领域，精确的物体姿态估计是实现高级交互任务的基础。pink_cube6数据集由研究团队于近期构建，专注于解决多视角下规则几何物体的六自由度姿态估计问题。该数据集通过系统采集粉色立方体在复杂环境中的图像序列，旨在推动基于视觉的抓取与放置算法的发展，为工业自动化及增强现实应用提供关键数据支撑。其设计强调了真实场景的多样性与标注的精确性，对提升模型在动态光照及遮挡条件下的鲁棒性具有重要价值。

当前挑战

该数据集针对物体姿态估计领域，核心挑战在于如何从单目或多视角图像中稳定恢复物体的精确三维位置与方向，尤其在纹理缺失或对称结构下易产生歧义性。构建过程中，研究人员面临数据采集的复杂性，需在多变光照与背景干扰下确保高精度标注；同时，立方体的规则几何特性增加了视角相似性，对标注一致性与算法区分度提出了更高要求。这些挑战共同推动了姿态估计算法在真实场景中的泛化能力探索。

常用场景

经典使用场景

在计算机视觉与机器人领域，pink_cube6数据集常被用于物体识别与姿态估计的研究。该数据集通过提供多视角、高分辨率的粉色立方体图像，为算法训练与评估奠定了坚实基础。研究者利用这些图像开发模型，以精确检测立方体在三维空间中的位置与方向，进而推动视觉感知技术的进步。

衍生相关工作

围绕pink_cube6数据集，衍生出多项经典研究工作，包括基于卷积神经网络的姿态预测模型、多传感器融合的物体跟踪系统等。这些工作不仅扩展了数据集的适用范围，还催生了新的算法框架，如端到端的视觉伺服控制方法，为后续研究提供了重要参考与灵感。

数据集最近研究