five

language_table

收藏
github2024-05-21 更新2024-05-31 收录
下载链接:
https://github.com/google-research/language-table
下载链接
链接失效反馈
官方服务:
资源简介:
442,226集真实机器人重标记数据。

442,226 sets of real robot relabeled data.
创建时间:
2022-11-05
原始信息汇总

数据集概述

数据集描述

  • Real Robot
    • language_table: 包含442,226个真实机器人重标记数据集的剧集。
  • Simulation (human)
    • language_table_sim: 包含181,020个模拟重标记数据集的剧集。
    • language_table_blocktoblock_sim: 包含8,000个单任务“块到块”数据集的剧集。
    • language_table_blocktoblock_4block_sim: 包含8,298个单任务“块到块”数据集的剧集,配置为4个块。
  • Simulation (oracle)
    • language_table_blocktoblock_oracle_sim: 包含200,000个单任务“块到块”数据集的剧集,由oracle脚本代理生成。
    • language_table_blocktoblockrelative_oracle_sim: 包含200,000个单任务“块到块相对”数据集的剧集,由oracle脚本代理生成。
    • language_table_blocktoabsolute_oracle_sim: 包含200,000个单任务“块到绝对位置”数据集的剧集,由oracle脚本代理生成。
    • language_table_blocktorelative_oracle_sim: 包含200,000个单任务“块到相对位置”数据集的剧集,由oracle脚本代理生成。
    • language_table_separate_oracle_sim: 包含200,000个单任务“分离块”数据集的剧集,由oracle脚本代理生成。

数据集摘要表

Dataset Real/sim Controlled by Language-labeled by # episodes
language_table real human human 442,226
language_table_sim sim human human 181,020
language_table_blocktoblock_sim sim human scripted 8,000
language_table_blocktoblock_4block_sim sim human scripted 8,298
language_table_blocktoblock_oracle_sim sim oracle scripted 200,000
language_table_blocktoblockrelative_oracle_sim sim oracle scripted 200,000
language_table_blocktoabsolute_oracle_sim sim oracle scripted 200,000
language_table_blocktorelative_oracle_sim sim oracle scripted 200,000
language_table_separate_oracle_sim sim oracle scripted 200,000

数据集路径

检查点

Name Config Checkpoint Location
BC+ResNet Sim language_table/train/configs/language_table_resnet_sim_local.py gs://gresearch/robotics/language_table_checkpoints/bc_resnet_sim_checkpoint_955000
搜集汇总
数据集介绍
main_image_url
构建方式
Language-Table数据集的构建基于人类收集的数据,涵盖了真实机器人和模拟环境中的多种任务。数据集包括442,226个真实机器人重新标注的片段,以及181,020个模拟重新标注的片段。此外,还包含了由脚本代理生成的200,000个模拟片段,这些片段涵盖了从块到块、块到绝对位置等多种任务。数据集的构建旨在支持开放词汇视觉语言运动学习的连续控制基准,通过多样化的任务和环境设置,确保数据的丰富性和多样性。
特点
Language-Table数据集的特点在于其大规模和多样性。数据集包含了近600,000个语言标注的轨迹,显著超过先前的可用数据集。此外,数据集不仅包括真实机器人数据,还涵盖了多种模拟环境中的任务,如块到块、块到绝对位置等,确保了数据的多任务性和广泛适用性。这些特点使得Language-Table成为研究开放词汇视觉语言运动学习的理想资源。
使用方法
使用Language-Table数据集时,用户可以通过pip安装相关依赖,并使用提供的示例脚本进行快速启动。数据集可以通过TensorFlow Datasets加载,具体路径可在Google Cloud Storage中找到。此外,数据集还提供了训练脚本和Colab教程,方便用户进行模型训练和实验。通过这些工具和资源,用户可以轻松地利用Language-Table数据集进行视觉语言运动学习的研究和开发。
背景与挑战
背景概述
Language-Table数据集是由Google Research团队创建的一个多任务连续控制基准,旨在推动开放词汇视觉语言运动学习的研究。该数据集包含了大量由人类收集和标注的真实机器人数据以及模拟数据,涵盖了多种任务类型,如块到块的移动、绝对位置和相对位置的定位等。通过这些数据,研究人员可以训练机器人执行复杂的语言指令,从而实现更高层次的交互和控制。Language-Table的发布不仅为机器人学领域提供了丰富的资源,还为自然语言处理和机器学习领域的交叉研究提供了新的视角。
当前挑战
Language-Table数据集在构建过程中面临了多个挑战。首先,数据集的多样性和复杂性要求高质量的标注和处理,以确保数据的准确性和一致性。其次,真实机器人数据与模拟数据的差异性需要通过精细的校准和验证来弥合,以确保训练模型的泛化能力。此外,数据集的规模庞大,如何高效地存储、管理和访问这些数据也是一个重要的技术挑战。最后,如何在保持数据多样性的同时,确保数据的安全性和隐私性,也是该数据集需要解决的关键问题。
常用场景
经典使用场景
在语言与机器人交互的领域中,Language-Table数据集的经典使用场景主要集中在训练机器人执行复杂的多任务指令。通过该数据集,研究人员可以训练机器人理解和执行从简单到复杂的自然语言指令,如'将红色方块移到蓝色方块旁边'或'用方块拼出一个笑脸'。这种训练不仅提升了机器人的语言理解能力,还增强了其在实际环境中的操作灵活性和准确性。
解决学术问题
Language-Table数据集解决了机器人学中长期存在的语言指令与物理操作之间的鸿沟问题。通过提供大规模的、语言标注的机器人操作轨迹,该数据集使得研究人员能够更有效地训练机器人理解和执行复杂的自然语言指令。这不仅推动了机器人语言理解技术的发展,还为实现更智能、更互动的机器人系统提供了坚实的基础。
衍生相关工作
基于Language-Table数据集,许多相关研究工作得以展开。例如,研究人员开发了新的深度学习模型,以提高机器人对复杂语言指令的理解能力;还有研究探索了如何通过实时语言反馈来指导机器人在动态环境中的操作。此外,该数据集还促进了跨学科的研究,如结合计算机视觉和自然语言处理技术,进一步提升机器人的综合智能水平。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作