sort_dentist_tools

Hugging Face2026-01-20 更新2026-01-22 收录

下载链接：

https://huggingface.co/datasets/AHegai/sort_dentist_tools

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，包含机器人技术相关的数据。数据集结构包括动作、观察（状态和来自腕部和顶部摄像头的图像）、时间戳和各种索引。数据集包含48个片段，94,440帧，存储在parquet文件中，并配有相关的视频文件。数据采用Apache 2.0许可证。

创建时间：

2026-01-16

原始信息汇总

数据集概述

基本信息

数据集名称: sort_dentist_tools
许可协议: Apache-2.0
任务类别: 机器人学
创建工具: LeRobot (https://github.com/huggingface/lerobot)

数据集规模与结构

总情节数: 53
总帧数: 102172
总任务数: 1
数据块大小: 1000
数据文件总大小: 500 MB
视频文件总大小: 3000 MB
帧率: 30 FPS
数据分割: 训练集 (0:53)
数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

特征字段

动作

字段名: action
数据类型: float32
形状: [6]
内容: 机械臂关节位置，包括 shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos。

观测状态

字段名: observation.state
数据类型: float32
形状: [6]
内容: 机械臂关节位置，与动作字段相同。

腕部摄像头图像

字段名: observation.images.wrist
数据类型: video
形状: [480, 640, 3]
视频信息:
- 高度: 480 像素
- 宽度: 640 像素
- 编解码器: av1
- 像素格式: yuv420p
- 非深度图
- 帧率: 30 FPS
- 通道数: 3
- 无音频

顶部摄像头图像

字段名: observation.images.top
数据类型: video
形状: [720, 1280, 3]
视频信息:
- 高度: 720 像素
- 宽度: 1280 像素
- 编解码器: av1
- 像素格式: yuv420p
- 非深度图
- 帧率: 30 FPS
- 通道数: 3
- 无音频

索引与元数据

timestamp: 时间戳，数据类型 float32，形状 [1]。
frame_index: 帧索引，数据类型 int64，形状 [1]。
episode_index: 情节索引，数据类型 int64，形状 [1]。
index: 索引，数据类型 int64，形状 [1]。
task_index: 任务索引，数据类型 int64，形状 [1]。

机器人信息

机器人类型: so101_follower
代码库版本: v3.0

搜集汇总

数据集介绍

构建方式

在机器人操作领域，数据集的构建往往依赖于实际物理系统的交互记录。sort_dentist_tools数据集通过LeRobot平台，利用so101_follower型机器人执行单一任务，系统采集了53个完整操作序列，共计超过10万帧数据。数据以分块形式存储，每块包含1000帧，并以Parquet格式高效组织，同时辅以同步录制的高帧率视频，确保了动作与观测信息在时序上的精确对齐。

使用方法

研究人员可通过加载数据集中预定义的Parquet文件与对应MP4视频文件进行访问。数据集已划分为完整的训练集，涵盖所有53个回合。典型的使用场景包括训练端到端的机器人策略模型，其中观测图像与关节状态可作为输入，而记录的动作向量则作为监督信号。由于数据包含时序索引，它也适用于序列建模或行为克隆任务，便于研究者复现与验证机器人操作算法在真实物理交互中的表现。

背景与挑战

背景概述

在机器人操作领域，模仿学习与强化学习的研究日益深入，旨在赋予机器人执行精细且结构化任务的能力。sort_dentist_tools数据集应运而生，由LeRobot团队基于其开源机器人学习框架构建，专注于牙科工具整理这一特定操作任务。该数据集采集自so101_follower型机器人平台，包含53个完整操作序列，总计超过十万帧的多模态数据，涵盖了关节状态、腕部与顶部摄像头视频流以及时间戳等丰富信息。其核心研究问题在于如何通过真实世界的交互数据，训练机器人掌握对细小、形状各异的牙科工具进行识别、抓取与分类整理的复杂技能，从而推动服务机器人在医疗辅助场景下的实际应用。

当前挑战

该数据集旨在解决的领域挑战，是机器人灵巧操作中普遍存在的样本效率低下与泛化能力不足问题。具体而言，牙科工具尺寸小、反光性强、形状多样，且整理任务对抓取姿态和放置精度要求极高，这给基于视觉的感知模块和连续动作控制策略带来了严峻考验。在数据构建过程中，挑战同样显著：真实机器人数据采集成本高昂，需确保操作的安全性与一致性；多模态数据（如高帧率视频与精确关节状态）的同步对齐与高效存储面临技术难题；此外，有限的任务场景与样本规模可能制约学习模型的泛化性能，如何从少量演示中提炼出鲁棒且可迁移的策略，是后续研究的关键瓶颈。

常用场景

经典使用场景

在机器人操作领域，sort_dentist_tools数据集为模仿学习提供了关键支持。该数据集通过记录机械臂在牙科工具整理任务中的动作序列与视觉观察，构建了从状态到动作的映射关系。研究人员利用这些数据训练策略模型，使机器人能够学习并复现人类操作者的精细动作，从而在无需显式编程的情况下完成复杂的工具分类与摆放任务。

解决学术问题

该数据集有效应对了机器人模仿学习中样本效率低下与泛化能力不足的挑战。通过提供高维度的关节位置数据与多视角视频流，它支持端到端策略学习的研究，促进了从原始感知到动作生成的直接映射。其结构化的时序数据有助于探索长期依赖建模与动作序列预测，为在动态环境中实现鲁棒且精确的操作控制提供了实证基础。

实际应用

在牙科诊所的自动化场景中，该数据集可直接应用于辅助机器人系统的开发。通过学习牙科工具的识别、抓取与归类操作，机器人能够协助医护人员进行手术前的器械准备或术后的整理工作，提升工作效率并降低交叉感染风险。此类系统有望扩展至其他医疗或精密装配领域，实现流程标准化与人力负担的减轻。

数据集最近研究