AHAT-dataset
收藏Hugging Face2026-04-23 更新2026-04-24 收录
下载链接:
https://huggingface.co/datasets/SII-liyang2024/AHAT-dataset
下载链接
链接失效反馈官方服务:
资源简介:
AHAT数据集是为论文《Any House Any Task: Scalable Long-Horizon Planning for Abstract Human Tasks》提供的官方数据集。该数据集包含用于AHAT的抽象人类指令、文本场景图和计划。数据集结构包括:ahat_eval_set.jsonl(包含348个任务,分为简单、中等和开放三个难度等级)、ahat_base_scenes.jsonl(包含308个从HSSD和Gibson数据集中整理和处理的基础文本场景图)和train/(包含50k个使用论文中详细方法合成和解决的训练样本,这是用于训练AHAT模型的主要数据集)。数据集的使用建议使用官方脚本进行选择性下载。
The AHAT dataset is the official dataset provided for the paper Any House Any Task: Scalable Long-Horizon Planning for Abstract Human Tasks. This dataset contains abstract human instructions, text scene graphs, and plans for AHAT. The dataset structure includes: ahat_eval_set.jsonl (containing 348 tasks, divided into three difficulty levels: simple, medium, and open), ahat_base_scenes.jsonl (containing 308 base text scene graphs curated and processed from the HSSD and Gibson datasets), and train/ (containing 50k training samples synthesized and solved using the detailed methods in the paper, which is the main dataset for training the AHAT model). The dataset usage recommends using the official script for selective downloading.
创建时间:
2026-04-22
原始信息汇总
🧢 AHAT 数据集概述
基本信息
- 许可证: CC-BY-NC-4.0
- 关联论文: Any House Any Task: Scalable Long-Horizon Planning for Abstract Human Tasks
- 代码仓库: AHAT GitHub
- 演示视频: AHAT accompanying video
数据集内容
该数据集包含论文中使用的抽象人类指令、文本场景图以及规划结果,旨在支持可扩展的长时域抽象人类任务规划。
数据集结构
数据集按以下文件组织:
| 文件 | 内容说明 |
|---|---|
ahat_eval_set.jsonl |
包含 348 个任务,按难度分为三个等级:简单(easy)、中等(medium)和开放(open) |
ahat_base_scenes.jsonl |
包含 308 个基础文本场景图,这些场景图来自 HSSD 和 Gibson 数据集,经过筛选和加工处理 |
train/ |
包含 50,000 个训练样本,使用论文中所述方法合成并求解,是训练 AHAT 模型的主要数据集 |
使用方式
推荐通过官方代码仓库中的下载脚本选择性下载数据:
- 克隆仓库:
git clone https://github.com/Sii-liuzhihong/AHAT - 安装依赖:
pip install -e . - 使用脚本下载:
- 下载评估集:
python scripts/download_data.py - 下载其他数据,请参考上述代码中的脚本说明
- 下载评估集:
引用格式
bibtex @article{liu2026ahat, title={Any House Any Task: Scalable Long-Horizon Planning for Abstract Human Tasks}, author={Liu, Zhihong and Li, Yang and Huang, Rengming and Lu, Cewu and Cai, Panpan}, journal={arXiv preprint arXiv:2602.12244}, year={2026} }
搜集汇总
数据集介绍

构建方式
AHAT数据集基于论文《Any House Any Task: Scalable Long-Horizon Planning for Abstract Human Tasks》构建,旨在支持长时域抽象人类任务的规划。该数据集通过大规模合成与求解方法论生成,核心组成部分包括:训练数据(train/)包含50,000个通过自动化流程合成的样本,每个样本涵盖抽象指令、文本化场景图及对应的规划结果;基础场景数据(ahat_base_scenes.jsonl)源自HSSD和Gibson数据集经过精细筛选与处理的308个基础场景图;评估集(ahat_eval_set.jsonl)包含348个任务,按难度划分为轻松、中等和开放三个层级,用于检验模型泛化能力。
特点
AHAT数据集的突出特点在于其高度的可扩展性与多样性。训练数据规模宏大,达50,000条,能够支撑深度模型的充分学习;基础场景覆盖多个真实室内数据集,确保场景的丰富性与现实性。评估集设计巧妙,通过三级难度划分,特别是“开放”层级,可有效评估模型在未见过语义组合下的长期规划能力。此外,数据集围绕抽象人类指令构建,而非简单的低层次动作序列,更贴近实际人机交互中的任务描述范式。
使用方法
建议用户使用官方提供的脚本进行数据下载与管理。具体步骤为:首先克隆AHAT代码仓库并安装依赖,通过命令‘git clone https://github.com/Sii-liuzhihong/AHAT’获取项目,随后执行‘pip install -e .’完成环境配置。下载评估集时,运行‘python scripts/download_data.py’即可;其他数据分量的获取方式可参考代码仓库中的相应说明。数据集以JSONL格式存储,便于逐行读取和处理,适用于长时域任务规划模型的训练与评估。
背景与挑战
背景概述
AHAT数据集由上海交通大学卢策吾教授团队联合Panpan Cai等研究人员于2026年创建,旨在解决具身智能领域中的长时序抽象任务规划问题。当前主流数据集多围绕具体操作任务构建,缺乏对高层语义指令与复杂环境交互的适配能力。该数据集包含50,000条训练样本及348条多难度等级的评估样本,通过从HSSD与Gibson数据集中萃取308个基础场景图,并辅以抽象人类指令与规划结果,构建了首个面向任意住宅环境的可扩展规划基准。其发布显著推动了室内机器人从单一任务执行向跨场景、长时序抽象规划能力的跃迁,为相关算法研究提供了标准化测试平台。
当前挑战
AHAT数据集面临的核心挑战源自两个方面。其一,领域问题层面,如何实现从抽象人类语言指令到具体行动序列的语义对齐是多模态规划的关键瓶颈,现有方法难以有效处理任务意图的模糊性与环境动态性。其二,构建过程中,需要从物理场景数据库(HSSD、Gibson)中提取结构化的文本场景图,并确保其语义覆盖真实住宅的多样性;同时合成50k样本时需平衡任务难度分布与规划解的合理性,这对数据筛选与验证流程提出了严苛要求,直接影响了数据集在实际部署中的泛化能力与鲁棒性。
常用场景
经典使用场景
AHAT-dataset(Any House Any Task)是一款专为抽象人类任务而构建的大规模长期规划数据集,其经典使用场景聚焦于跨家庭环境的抽象指令理解与多步任务规划。通过整合来自HSSD与Gibson等真实场景的308个基础场景图,以及由5万条合成训练样本和348个多层次评估任务组成的数据体系,研究者可在“任意房屋、任意任务”的开放设定下训练和评测智能体从自然语言指令(如“准备早餐”)中推理出具体行动序列的能力。该数据集不仅支持可扩展的长期规划基准测试,还提供了从简单到开放式三档难度划分,为探索家庭服务机器人、虚拟助手等领域的抽象推理与可迁移规划技术提供了标准化平台。
衍生相关工作
AHAT-dataset的发布已衍生出多项具有影响力的相关工作,包括但不限于基于该数据集的长期规划模型AHAT本身,以及后续针对跨任务迁移的规划器、数据高效微调策略和场景图增强技术。原论文提出的范式——利用大规模合成数据进行预训练,再在少量真实场景上微调——激发了后续研究者探索更复杂的层级化因果推理与抽象状态抽象方法。此外,评估集中的三类难度任务(简单、中等、开放)已成为衡量家庭规划模型鲁棒性与泛化能力的标准测试床,催生了诸如开放词汇行动计划生成、反思式规划与失败恢复机制等创新方向。这些衍生工作共同将抽象人类任务规划推向一个更加成熟、可比的学术生态。
数据集最近研究
最新研究方向
AHAT-dataset聚焦于抽象人类任务的可扩展长程规划,旨在弥合高层自然语言指令与具身智能体在复杂家居环境中执行细粒度动作之间的鸿沟。该数据集通过整合HSSD与Gibson场景的文本化场景图,构建了包含50万训练样本及多难度评估集的大规模语料库,推动从指令理解到序列化规划的端到端学习。当前前沿方向集中于利用该数据集的多样性解决零样本泛化与长时域任务分解难题,相关研究已将其应用于家庭服务机器人、虚拟助手等热点领域,显著提升了对非结构化指令的鲁棒响应能力,为具身智能迈向通用化任务执行奠定了关键数据基础。
以上内容由遇见数据集搜集并总结生成



