five

facebook/PUG_SPAR

收藏
Hugging Face2024-01-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/facebook/PUG_SPAR
下载链接
链接失效反馈
官方服务:
资源简介:
PUG: SPAR(场景、位置、属性、关系)包含43,560个测试样本,这些样本包含图像-描述对,用于评估视觉语言模型(VLM)的场景和对象识别能力,以及对象间和对象属性间的关系。我们利用包含最多两个对象的场景,这些场景具有4种独特的空间关系和4种不同的纹理变化。

PUG: SPAR(场景、位置、属性、关系)包含43,560个测试样本,这些样本包含图像-描述对,用于评估视觉语言模型(VLM)的场景和对象识别能力,以及对象间和对象属性间的关系。我们利用包含最多两个对象的场景,这些场景具有4种独特的空间关系和4种不同的纹理变化。
提供机构:
facebook
原始信息汇总

数据集概述

数据集信息

  • 特征列表

    • image: 图像数据
    • world_name: 场景名称
    • character_name: 角色名称
    • character2_name: 第二个角色名称
    • character1_pos: 角色位置
    • character2_pos: 第二个角色位置
    • character_texture: 角色纹理
    • character2_texture: 第二个角色纹理
  • 数据分割

    • train: 训练集,包含43,560个样本,数据大小为17,215,863,251.4字节
  • 数据集大小

    • 下载大小:17,185,543,222字节
    • 实际大小:17,215,863,251.4字节

配置信息

  • 默认配置
    • data_files: 训练集数据文件路径为data/train-*

数据集描述

  • PUG: SPAR:包含43,560个测试样本,图像-文本对评估视觉语言模型的场景和对象识别,以及对象间和对象-属性关系。场景中最多包含两个对象,具有4种独特空间关系和4种不同纹理变化。

许可证

  • CC-BY-NC 4.0:数据集在CC-BY-NC许可下发布,不得用于训练生成式AI模型。

引用

  • PUG数据集引用

    @misc{bordes2023pug, title={PUG: Photorealistic and Semantically Controllable Synthetic Data for Representation Learning}, author={Florian Bordes and Shashank Shekhar and Mark Ibrahim and Diane Bouchacourt and Pascal Vincent and Ari S. Morcos}, year={2023}, eprint={2308.03977}, archivePrefix={arXiv}, primaryClass={cs.CV} }

搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作