five

egodex_rfm

收藏
Hugging Face2025-10-29 更新2025-10-30 收录
下载链接:
https://huggingface.co/datasets/jesbu1/egodex_rfm
下载链接
链接失效反馈
官方服务:
资源简介:
egodex_part1和egodex_test数据集包含多个字段,如id(字符串),task(字符串),lang_vector(浮点数列表),data_source(字符串),frames(字符串),is_robot(布尔值),quality_label(字符串),partial_success(浮点数)。数据集分为训练集,egodex_part1的训练集包含45232个例子,大小为79324699字节;egodex_test的训练集包含3215个例子,大小为5630581字节。
创建时间:
2025-10-29
原始信息汇总

EgoDex 数据集概述

数据集基本信息

  • 数据集名称: EgoDex
  • 存储位置: https://huggingface.co/datasets/jesbu1/egodex_rfm
  • 配置数量: 4个独立配置

数据集配置详情

egodex_part1

  • 样本数量: 45,232
  • 数据大小: 79,324,699字节
  • 下载大小: 22,448,728字节
  • 特征字段:
    • id (字符串)
    • task (字符串)
    • lang_vector (浮点数列表)
    • data_source (字符串)
    • frames (字符串)
    • is_robot (布尔值)
    • quality_label (字符串)
    • partial_success (浮点数)

egodex_part2

  • 样本数量: 94,488
  • 数据大小: 165,813,136字节
  • 下载大小: 55,197,757字节
  • 特征字段: 与egodex_part1相同

egodex_part3

  • 样本数量: 51,899
  • 数据大小: 91,197,475字节
  • 下载大小: 26,545,487字节
  • 特征字段: 与egodex_part1相同

egodex_test

  • 样本数量: 3,215
  • 数据大小: 5,630,581字节
  • 下载大小: 4,545,953字节
  • 特征字段: 与egodex_part1相同

数据特征说明

所有配置包含相同的特征结构:

  • 标识字段: id
  • 任务字段: task
  • 语言向量: lang_vector (float32列表)
  • 数据来源: data_source
  • 帧数据: frames
  • 机器人标识: is_robot
  • 质量标签: quality_label
  • 部分成功率: partial_success

数据分割

所有配置仅包含训练分割(train split)

搜集汇总
数据集介绍
main_image_url
构建方式
在具身智能研究领域,egodex_rfm数据集通过系统化采集第一人称视角交互数据构建而成。该数据集采用模块化架构设计,划分为四个逻辑分区,涵盖训练与测试场景。数据采集过程整合了多模态信息,每个样本包含语言指令向量、任务类型标识、帧序列数据以及质量评估标签,并通过机器人状态标识区分交互主体。数据来源经过标准化处理,确保样本间的一致性与可比性。
特点
该数据集的核心特征体现在其丰富的多模态数据结构和精细的质量标注体系。每个数据样本均包含连续帧序列与对应的语言指令嵌入向量,形成视觉-语言的强对齐关系。特别设计的质量标签体系从多个维度评估样本质量,部分成功度量化指标为强化学习研究提供细粒度监督信号。数据集规模庞大且分布均衡,三个训练分区共包含近二十万样本,测试集独立划分确保评估可靠性。
使用方法
研究者可通过HuggingFace平台直接加载egodex_rfm数据集的不同配置分区进行模型开发。数据集支持标准数据加载流程,用户可分别调用egodex_part1至part3作为训练集,egodex_test作为验证基准。每个样本的结构化字段便于端到端模型训练,语言向量可直接输入语义理解模块,帧序列适用于视觉表征学习,质量标签则为策略优化提供监督信号。数据集的模块化设计支持灵活的组合使用方式,满足不同研究场景的需求。
背景与挑战
背景概述
在具身智能研究领域,如何实现机器人对自然语言指令的精确理解和环境交互成为关键科学问题。egodex_rfm数据集应运而生,其通过整合多模态数据源,聚焦于第一人称视角下的任务执行轨迹记录。该数据集构建了包含语言向量、任务类型、帧序列及质量标签的结构化框架,为研究机器人在真实场景中的指令遵循与动作规划能力提供了重要基准。
当前挑战
该数据集致力于解决具身智能领域中的视觉语言导航与任务执行问题,其核心挑战在于跨模态对齐的复杂性,即如何建立语言指令与视觉动作序列的精确映射关系。在构建过程中,数据采集面临时空一致性的技术难题,需同步处理高维视觉流与语言嵌入;同时质量标注的粒度控制要求人工评估与自动化验证相结合,这对数据标准化提出了更高要求。
常用场景
解决学术问题
该数据集有效应对了具身智能中语义理解与动作执行的衔接难题,通过标注部分成功率指标,量化了任务执行效果,为研究机器人任务完成度与指令遵循精度提供了实证基础。其语言向量特征助力解决自然语言到机器人动作空间的转换问题,推动了跨模态表示学习的发展,显著提升了智能体在动态环境中的适应能力。
衍生相关工作
基于该数据集,研究者们衍生出多项经典工作,包括结合强化学习的机器人任务规划模型、跨模态对齐的表示学习方法,以及针对部分成功任务的优化算法。这些工作不仅拓展了数据集的应用边界,还推动了具身智能领域在动作预测、任务泛化等方面的理论创新与技术突破。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作