RoCoBench
收藏arXiv2025-09-30 收录
下载链接:
https://project-roco.github.io
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个包含6个任务的综合基准,覆盖了广泛的多机器人协作场景。此外,还提供了一个仅包含文本的数据集,用于代理表示和推理。它包括了诸如分类立方体、打包杂货和制作三明治等任务,这些任务旨在评估在多机器人场景中对话代理的有效性。总的来说,这些任务是针对多机器人协作任务而设计的。
This dataset is a comprehensive benchmark comprising six tasks, covering a wide range of multi-robot collaboration scenarios. Additionally, a text-only dataset is provided for agent representation and reasoning. It includes tasks such as sorting cubes, packing groceries, and making sandwiches, which are designed to evaluate the effectiveness of dialogue agents in multi-robot scenarios. Overall, these tasks are specifically tailored for multi-robot collaboration tasks.
提供机构:
Authors of the paper
搜集汇总
数据集介绍

背景与挑战
背景概述
RoCoBench是一个包含6个多机器人协作任务的数据集,旨在评估大型语言模型在机器人协作中的策略讨论、子任务规划和路径生成能力。此外,数据集还提供了一个纯文本版本RoCoBench-Text,专门用于测试LLMs在代理表示和任务推理方面的表现。
以上内容由遇见数据集搜集并总结生成



