facebook/PUG_SPAR
收藏Hugging Face2024-01-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/facebook/PUG_SPAR
下载链接
链接失效反馈官方服务:
资源简介:
PUG: SPAR(场景、位置、属性、关系)包含43,560个测试样本,这些样本包含图像-描述对,用于评估视觉语言模型(VLM)的场景和对象识别能力,以及对象间和对象属性间的关系。我们利用包含最多两个对象的场景,这些场景具有4种独特的空间关系和4种不同的纹理变化。
PUG: SPAR(场景、位置、属性、关系)包含43,560个测试样本,这些样本包含图像-描述对,用于评估视觉语言模型(VLM)的场景和对象识别能力,以及对象间和对象属性间的关系。我们利用包含最多两个对象的场景,这些场景具有4种独特的空间关系和4种不同的纹理变化。
提供机构:
facebook
原始信息汇总
数据集概述
数据集信息
-
特征列表:
image: 图像数据world_name: 场景名称character_name: 角色名称character2_name: 第二个角色名称character1_pos: 角色位置character2_pos: 第二个角色位置character_texture: 角色纹理character2_texture: 第二个角色纹理
-
数据分割:
train: 训练集,包含43,560个样本,数据大小为17,215,863,251.4字节
-
数据集大小:
- 下载大小:17,185,543,222字节
- 实际大小:17,215,863,251.4字节
配置信息
- 默认配置:
data_files: 训练集数据文件路径为data/train-*
数据集描述
- PUG: SPAR:包含43,560个测试样本,图像-文本对评估视觉语言模型的场景和对象识别,以及对象间和对象-属性关系。场景中最多包含两个对象,具有4种独特空间关系和4种不同纹理变化。
许可证
- CC-BY-NC 4.0:数据集在CC-BY-NC许可下发布,不得用于训练生成式AI模型。
引用
-
PUG数据集引用:
@misc{bordes2023pug, title={PUG: Photorealistic and Semantically Controllable Synthetic Data for Representation Learning}, author={Florian Bordes and Shashank Shekhar and Mark Ibrahim and Diane Bouchacourt and Pascal Vincent and Ari S. Morcos}, year={2023}, eprint={2308.03977}, archivePrefix={arXiv}, primaryClass={cs.CV} }
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



