3D-PC
收藏数据集概述
数据集名称
- 3D-PC
数据集内容
- 任务类型:包含三个任务,分别是VPT-basic(基本视觉视角任务)、VPT-strategy(策略性视觉视角任务)和depth order(深度排序)。
- 数据组织:
-
训练集:包含所有训练图像,按类别组织。结构如下:
train | |<category> | |<object> | |<setting> | |<*.png>
对应的标签文件为
train_perspective.csv和depth_perspective.csv,以及平衡版本的train_perspective_balanced.csv和depth_perspective_balanced.csv。 -
测试集:包含所有数据分割,用于VPT和depth order任务。结构如下:
perspective/depth | |<split> | |<category> 0/1 | |_<*.png>
-
数据集访问
-
Hugging Face:提供所有三个任务的数据。 python from datasets import load_dataset dataset = load_dataset("pzhou10/3D-PC", "vpt-basic")
-
完整数据集下载:提供完整的3D-PC数据集及训练和测试数据分割。
- 下载链接:https://connectomics.clps.brown.edu/tf_records/VPT/
数据集使用
- TIMM评估:
-
线性探针:
python run_linear_probe.py --task <task> --data_dir <data_folder>/<task>/ --model_name <model_name>
-
微调:
python run_finetune.py --task <task> --data_dir <data_folder>/<task>/ --model_name <model_name>
-
引用信息
@misc{linsley20243dpc, title={The 3D-PC: a benchmark for visual perspective taking in humans and machines}, author={Drew Linsley and Peisen Zhou and Alekh Karkada Ashok and Akash Nagaraj and Gaurav Gaonkar and Francis E Lewis and Zygmunt Pizlo and Thomas Serre}, year={2024}, eprint={2406.04138}, archivePrefix={arXiv}, primaryClass={cs.CV} }




