PAP-12K
收藏数据集概述
数据集名称
Panoramic Affordance Prediction (PAP) 数据集,亦称 PAP-12K 数据集。
核心任务
全景可供性预测。这是首个针对全景(360度)图像进行可供性预测的探索性任务,旨在克服传统基于针孔相机模型方法视野狭窄、观测碎片化的问题,以捕捉全局空间关系并实现整体场景理解。
数据集规模与构成
- 图像数量:包含 1,003 张原生捕获的超高分辨率(12K)全景图像。
- 数据来源:100% 真实世界,采集自多样化的室内环境。
- 标注内容:包含超过 13,000 个基于推理的问答对,并配有像素级可供性掩码。
数据集内容与结构
- 环境类别:包含阳台 (
balcony)、浴室 (bathroom)、卧室 (bedroom) 等多种室内场景。 - 组织结构:数据按场景类别和图像序列组织。每张图像对应一个文件夹,其下包含该图像中各个可供性物体(如洗衣机、水龙头)的子文件夹。
- 文件构成:
- 全景图像文件(如
0001.jpg)。 - 针对每个可供性物体的标注文件夹,内含:
- 掩码文件 (
mask.png)。 - 可供性问题文件 (
affordance_question.txt)。
- 掩码文件 (
- 全景图像文件(如
示例结构:
PAP-12K/ ├── balcony/ │ ├── 0001/ │ │ ├── washing_machine/ │ │ │ ├── mask.png │ │ │ └── affordance_question.txt │ │ ├── faucet/ │ │ ├── ... │ │ └── 0001.jpg │ ├── 0002/ │ └── ... ├── bathroom/ ├── bedroom/ └── ...
获取方式
- Google Drive:https://drive.google.com/file/d/1Bq4wLL9AoSBP1Im545qKWlk85cP21VQE/view?usp=sharing
- 百度网盘:https://pan.baidu.com/s/1FeNdQ67vkfUYX0qXerInTw?pwd=u8vd
- 在线预览:https://zixinzhang02.github.io/Panoramic-Affordance-Prediction/#dataset-preview
相关资源
- 项目主页:https://zixinzhang02.github.io/Panoramic-Affordance-Prediction/
- 论文(高清):https://zixinzhang02.github.io/Panoramic-Affordance-Prediction/static/papers/Paper_high_res.pdf
- 论文(arXiv):https://arxiv.org/abs/2603.15558
- 官方代码仓库:https://github.com/EnVision-Research/PAP
发布日期
数据集与推理代码于 2026-03-16 发布。
引用信息
@article{zhang2026pap, title={Panoramic Affordance Prediction}, author={Zhang, Zixin and Liao, Chenfei and Zhang, Hongfei and Chen, Harold Haodong and Chen, Kanghao and Wen, Zichen and Guo, Litao and Ren, Bin and Zheng, Xu and Li, Yinchuan and Hu, Xuming and Sebe, Nicu and Chen, Ying-Cong}, journal={arXiv preprint arXiv:2603.15558}, year={2026} }




