PARSEC

Name: PARSEC
Creator: 乔治亚理工学院
Published: 2025-05-16 18:40:44
License: 暂无描述

arXiv2025-05-16 更新2025-05-20 收录

下载链接：

https://github.com/kartikvrama/parsec

下载链接

链接失效反馈

官方服务：

资源简介：

PARSEC是一个用于学习用户组织偏好的对象整理基准数据集，该数据集包含来自72位用户的11万个整理示例，涵盖了93个对象类别和15个环境实例。该数据集的收集旨在解决机器人对象整理中的个性化、部分排列环境中的对象放置以及对新对象和新环境的泛化问题。数据集通过观察用户整理对象的方式，来学习用户偏好，以在没有明确指令的情况下将对象放置在部分整理过的环境中。

PARSEC is a benchmark dataset for learning user organizational preferences in robotic object rearrangement. It contains 110,000 arrangement examples from 72 users, covering 93 object categories and 15 environment instances. This dataset is collected to address three key challenges in robotic object rearrangement: personalization, object placement in partially arranged environments, and generalization to novel objects and environments. The dataset learns user preferences by observing users' object arrangement behaviors, enabling it to place objects in partially arranged environments without explicit instructions.

提供机构：

乔治亚理工学院

创建时间：

2025-05-16

搜集汇总

数据集介绍

构建方式

PARSEC数据集的构建基于众包策略，通过72名用户在15种家庭环境中对93类日常物品进行整理任务的真实操作记录，共收集了432个物品排列样本。研究者通过系统化采样，将每个用户的6次排列实例交叉组合，生成11万条包含部分排列环境与待放置物品的元组（m, AO, AP, XU），其中AO代表历史观察序列，AP表示当前半排列环境状态，XU为待放置物品集合。数据生成过程特别设计了环境空白状态与不同占用密度的部分排列场景，以全面覆盖现实家庭中物品整理的复杂性。

特点

该数据集的核心价值体现在三方面：首先，通过真实用户行为捕捉了规则化方法难以模拟的个性化偏好多样性，如图3所示用户间物品分组相似度显著低于规则基准；其次，环境设计涵盖相似表面一维/二维布局（Similar-1D/2D）与异质表面（Dissimilar）三类语义场景，每类环境对物品分组逻辑与表面选择策略提出不同挑战；最后，每个样本同时编码历史偏好（AO）与当前环境上下文（AP）双重信息源，为多模态上下文融合研究提供结构化基础。数据标注采用自然语言描述的物品类别与表面位置元组，支持语义与空间关系的联合建模。

使用方法

使用该数据集需遵循三阶段流程：在预处理阶段，需将自然语言描述的物品表面关系转化为图结构或嵌入向量，其中表面位置建议采用二维相对坐标编码；模型训练时推荐采用k折交叉验证，划分时需保持用户与环境类别的互斥性以测试泛化能力；评估指标应组合使用场景编辑距离（SED）与错误分组物品数（IGO），分别衡量表面选择准确性与语义分组一致性。对于LLM类方法，可直接将AO中的历史排列转化为Python风格pick-place指令作为提示词，并利用环境状态描述模板实现零样本迁移。在部分排列场景（AP≠∅）测试时，需特别关注模型对已存在物品排列的保持能力。

背景与挑战

背景概述

PARSEC数据集由Kartik Ramachandruni和Sonia Chernova于2025年提出，旨在解决家庭服务机器人在物体重排任务中的个性化适应问题。该数据集聚焦于从场景上下文中学习用户的组织偏好，以在部分已排列的环境中放置物体。PARSEC基于72名用户众包的11万条重排示例，涵盖93种物体类别和15种环境，为机器人学习用户偏好提供了丰富的数据支持。该数据集的建立填补了现有数据在真实用户数据、用户偏好多样性和环境覆盖范围上的不足，推动了个性化重排领域的研究。

当前挑战

PARSEC数据集面临的挑战主要包括两个方面：在领域问题层面，如何从有限的场景上下文中准确推断用户偏好，并在部分已排列的环境中实现有意义的物体放置；在构建过程层面，如何收集和标注大规模的真实用户重排数据，确保数据的多样性和代表性。此外，数据集还需解决新物体和新环境的泛化问题，以及如何建模不同环境类别下的语义信息，这些都对模型的适应能力提出了更高要求。

常用场景

经典使用场景

PARSEC数据集在机器人个性化物体重排任务中展现了其经典应用场景。通过收集72名真实用户在15种不同环境中的11万次物体排列数据，该数据集为研究如何从场景上下文中学习用户组织偏好提供了丰富资源。在典型应用场景中，机器人需要根据部分已排列环境中的物体分布，结合用户历史排列模式，预测新物体的合理摆放位置。这种场景模拟了家庭环境中机器人协助整理物品的实际需求，如整理厨房 pantry 或冰箱物品等常见家务任务。

解决学术问题

PARSEC数据集有效解决了机器人个性化重排领域的三个关键学术问题：无显式指令下的用户偏好推断、部分已排列环境中的物体合理放置，以及对新物体和新环境的泛化能力。传统方法或依赖单一场景上下文，或无法处理环境语义差异，而该数据集通过融合先验场景上下文和当前场景上下文，为开发能同时处理这些挑战的算法提供了基准。特别是其结构化偏好表示方法，解决了多有效摆放位置带来的模糊性问题，推动了基于大语言模型的个性化重排研究。

衍生相关工作

基于PARSEC数据集已衍生出多个经典研究工作，最具代表性的是ContextSortLM模型。该模型创新性地将大语言模型与结构化偏好表示相结合，在保持环境现有排列的同时适应新物体摆放。其他重要工作包括APRICOT-NonInteractive的文本偏好描述方法、TidyBot-Random的随机规则采样策略等。这些工作共同推动了多源场景上下文融合、零样本泛化等方向的进展，为后续基于语义推理的个性化重排研究奠定了基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集