local-dataset
收藏Hugging Face2026-04-21 更新2026-04-22 收录
下载链接:
https://huggingface.co/datasets/glannuzel/local-dataset
下载链接
链接失效反馈官方服务:
资源简介:
Reachy Mini Moves 是一个由社区贡献的 Marionette 动作记录数据集,专为 Reachy Mini 机器人设计。数据集包含 2 个动作记录,总运动时间为 10.0 秒,每个动作配有音频轨道。数据以 JSON 轨迹文件(遵循 Reachy Mini 情感模式)和可选的 WAV 音频文件形式存储。每个动作记录包含 move_id(动作ID)、description(描述)、duration_seconds(持续时间)和 has_audio(是否有音频)等字段。数据集适用于机器人技术领域的研究和应用,特别是与 Reachy Mini 机器人相关的动作控制和情感表达任务。数据集通过 Marionette Reachy Mini 应用录制并上传至 Hugging Face,鼓励用户在衍生作品中保留 reachy_mini_community_moves 标签以便社区发现相关资源。
创建时间:
2026-04-20
原始信息汇总
数据集概述:Local dataset • Reachy Mini Moves
基本信息
- 数据集名称:Local dataset • Reachy Mini Moves
- 数据集页面:https://huggingface.co/datasets/glannuzel/local-dataset
- 许可证:Apache-2.0
- 任务类别:机器人学(robotics)
- 语言:英语(en)
- 标签:reachy_mini_community_moves
数据集内容
该数据集包含社区贡献的 Marionette 录制动作,这些动作是在 Reachy Mini 机器人上捕获的。具体数据如下:
- 上传动作数量:2 个
- 总运动时长:10.0 秒
- 音频轨道数量:2 个
- 最后更新:2026-04-21T12:48:13Z
数据特征
数据集包含以下特征字段:
- move_id:字符串类型,动作标识符
- description:字符串类型,动作描述
- duration_seconds:浮点数类型,动作持续时间(秒)
- has_audio:布尔类型,是否包含音频
数据集划分与规模
- 训练集:包含 2 个样本,共 1,373,242 字节
- 下载大小:1,373,242 字节
- 数据集总大小:1,373,242 字节
数据文件
数据文件位于 data/ 目录下,每个动作以 JSON 格式存储(遵循 Reachy Mini 情感模式),并附带可选的 WAV 音频文件(直接从机器人录制)。默认配置下的训练数据文件路径为:data/*.json
所选动作列表
| 动作名称 | 持续时间 | 音频 | 录制时间(UTC) |
|---|---|---|---|
| write-tag-5 | 5.0 秒 | 是 | 2026-04-21 12:45 |
| write-tag-6 | 5.0 秒 | 是 | 2026-04-21 12:48 |
数据集生成方式
这些动作是使用 Marionette Reachy Mini 应用程序录制的。用户可以选择要分享的动作,设置 Hugging Face 用户名,在本地运行 huggingface-cli login,然后在 Marionette 中点击 Synchronize to Hugging Face dataset 按钮。应用程序会打包所选文件,生成此 README 文件,并将其上传至 glannuzel/local-dataset。
复用说明
- 引用该数据集时,请使用名称
glannuzel/local-dataset - 在分享衍生数据集时,请保留
reachy_mini_community_moves标签,以便社区能够发现相关数据集
搜集汇总
数据集介绍

构建方式
本数据集源于社区贡献,通过Marionette Reachy Mini应用录制机器人木偶动作轨迹。用户可在应用中挑选待分享的动作,设置Hugging Face用户名并完成本地登录后,点击“同步至Hugging Face数据集”按钮,应用便会自动打包所选JSON轨迹文件(遵循Reachy Mini情感模式架构)及可选的机器人直接录制的WAV音频,生成说明文档并上传至指定仓库。当前数据集包含两次录制,文件存储于data/目录下。
特点
该数据集聚焦于机器人动作与情感表达,包含两项名为write-tag-5与write-tag-6的动作记录,每项持续5秒,均附带音频轨道,总动作时长10秒。数据以JSON格式存储轨迹,支持社区复用与衍生,通过reachy_mini_community_moves标签便于发现关联集合,采用Apache-2.0许可证开放共享,具备标准化结构与良好的可扩展性。
使用方法
用户可通过Hugging Face平台直接加载使用本数据集,引用时标注为glannuzel/local-dataset。数据以default配置组织,训练分片包含两个样本,文件路径为data/*.json。适用于机器人动作分析与情感模拟研究,支持基于轨迹和音频的联合建模。衍生作品需保留reachy_mini_community_moves标签以促进社区发现,符合开源协作精神。
背景与挑战
背景概述
在机器人学领域,运动轨迹数据集对于开发自然的人机交互至关重要,尤其是针对仿人机器人如Reachy Mini。该数据集由Pollen Robotics社区于2026年创建,由研究人员Glannuzel主导,旨在捕捉通过木偶操控应用记录的机器人动作,涵盖关节轨迹和可选音频。核心研究问题在于如何利用社区贡献的少量但高质量的运动样本,推动机器人动作生成与情感表达的标准化。尽管数据集仅包含两个动作,但其贡献在于提供了从实际机器人录制的JSON轨迹和音频,为机器人学习中的少样本模仿和情感动作生成提供了基础资源,对社区驱动的机器人运动数据集构建具有启发性影响。
当前挑战
该数据集面临的领域挑战主要涉及机器人动作数据的稀缺性与多样性不足,具体体现在:1)仅有2个动作和10秒总时长,难以支撑大规模机器学习模型的训练,限制了其在动作生成、泛化及情感表达分析中的应用;2)动作类型单一(均为标签书写),缺乏复杂任务如抓取、导航或交互式反应的覆盖。构建过程中的挑战包括:数据通过社区贡献产生,依赖用户主动分享,导致数据量不可控且更新缓慢;此外,音频与轨迹的同步录制对硬件和软件环境有严格要求,易受录音质量或机器人状态不一致的影响,增加了数据清洁与标准化难度。
常用场景
经典使用场景
在机器人学与人类行为模仿研究领域,该数据集主要服务于基于示教学习(Learning from Demonstration)范式的运动轨迹复现任务。其核心价值在于通过记录Reachy Mini机器人执行特定动作的关节序列与时间戳,为研究者提供可复现的物理运动基准。经典使用场景包括将JSON格式的轨迹数据作为输入,训练机器人学习书写标签等精细操作,同时利用同步录制的音频信号开展多模态行为映射研究,例如探索语音指令与肢体动作之间的时序关联。
衍生相关工作
该数据集催生了多项具有代表性的衍生研究,包括基于对比学习的跨本体动作迁移方法,其通过对齐Reachy Mini与其它仿人机器人的运动特征空间实现技能共享。另一项经典工作是在时序动作分割任务中,利用该数据集的精细标注轨迹训练生成对抗网络,实现了连续动作序列到离散操作基元的自动分解。社区还在此基础上发展了隐私保护型的联邦学习框架,使得分散在各地的机器人能够协同优化运动策略而无需共享原始数据。
数据集最近研究
最新研究方向
在机器人学习与具身智能领域,社区驱动的运动数据集正成为推动人机交互研究的关键资源。local-dataset作为Reachy Mini机器人的社区贡献动作捕捉集合,其前沿研究方向聚焦于通过少量示范轨迹实现机器人动作的泛化与迁移学习。当前热点事件包括利用此类微数据集进行少样本模仿学习,以及结合音频模态增强机器人表达的自然度与情感共鸣。该数据集的意义在于降低机器人行为编程的门槛,鼓励社区共享运动先验知识,为构建更加灵活、具有表现力的社交机器人奠定数据基础,并推动了从封闭式工业数据集向开放协作式机器人数据生态的范式转变。
以上内容由遇见数据集搜集并总结生成



