t2i-compbench

Hugging Face2024-10-15 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/sayakpaul/t2i-compbench

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是T2I-CompBench的一部分，包含多个配置和分割的文本文件，主要用于文本数据。数据集包括如'3d_spatial_train'、'color_val'、'complex_train'、'shape_val'、'texture_train'等多种配置，每个配置都有特定的特征和分割。特征主要是文本数据，分割包括不同数量和大小训练和验证集。数据集是用于文本到图像生成的综合基准，并基于MIT许可证。数据集从GitHub仓库获取并推送到Hugging Face Hub。

This dataset is a component of T2I-CompBench. It contains multiple text files with distinct configurations and splits, primarily focused on text-based data. The dataset includes various configurations such as "3d_spatial_train", "color_val", "complex_train", "shape_val", "texture_train", and others. Each configuration has its own specific characteristics and predefined data splits. The core features of the dataset are text data, and the splits comprise training and validation sets with varying quantities and sizes. This dataset serves as a comprehensive benchmark for text-to-image generation and is released under the MIT License. The dataset was sourced from a GitHub repository and pushed to the Hugging Face Hub.

创建时间：

2024-10-15

原始信息汇总

T2I-CompBench 数据集概述

数据集配置

3d_spatial_train

特征:
- text: string
分割:
- spatial_train: 700个样本, 20587字节
下载大小: 8050字节
数据集大小: 20587字节

3d_spatial_val

特征:
- text: string
分割:
- spatial_val: 300个样本, 8752字节
下载大小: 4105字节
数据集大小: 8752字节

color_train

特征:
- text: string
分割:
- train: 700个样本, 27656字节
下载大小: 11306字节
数据集大小: 27656字节

color_val

特征:
- text: string
分割:
- val: 300个样本, 12477字节
下载大小: 6029字节
数据集大小: 12477字节

color_val_seen

特征:
- text: string
分割:
- val_seen: 200个样本, 6801字节
下载大小: 3553字节
数据集大小: 6801字节

color_val_unseen

特征:
- text: string
分割:
- val_unseen: 100个样本, 5676字节
下载大小: 3461字节
数据集大小: 5676字节

complex_train

特征:
- text: string
分割:
- train: 700个样本, 54440字节
下载大小: 25014字节
数据集大小: 54440字节

complex_train_action

特征:
- text: string
分割:
- train_action: 504个样本, 43025字节
下载大小: 21082字节
数据集大小: 43025字节

complex_train_spatial

特征:
- text: string
分割:
- train_spatial: 130个样本, 6864字节
下载大小: 3433字节
数据集大小: 6864字节

complex_train_spatialaction

特征:
- text: string
分割:
- train_spatialaction: 66个样本, 4551字节
下载大小: 3377字节
数据集大小: 4551字节

complex_val

特征:
- text: string
分割:
- val: 300个样本, 23326字节
下载大小: 12728字节
数据集大小: 23326字节

complex_val_action

特征:
- text: string
分割:
- val_action: 212个样本, 18124字节
下载大小: 10653字节
数据集大小: 18124字节

complex_val_spatial

特征:
- text: string
分割:
- val_spatial: 58个样本, 3014字节
下载大小: 2221字节
数据集大小: 3014字节

complex_val_spatialaction

特征:
- text: string
分割:
- val_spatialaction: 30个样本, 2188字节
下载大小: 2439字节
数据集大小: 2188字节

non_spatial_train

特征:
- text: string
分割:
- spatial_train: 700个样本, 43119字节
下载大小: 23227字节
数据集大小: 43119字节

non_spatial_val

特征:
- text: string
分割:
- spatial_val: 300个样本, 18350字节
下载大小: 10917字节
数据集大小: 18350字节

numeracy_train

特征:
- text: string
分割:
- train: 700个样本, 27955字节
下载大小: 13808字节
数据集大小: 27955字节

numeracy_val

特征:
- text: string
分割:
- val: 300个样本, 11764字节
下载大小: 6744字节
数据集大小: 11764字节

shape_train

特征:
- text: string
分割:
- train: 700个样本, 42195字节
下载大小: 16720字节
数据集大小: 42195字节

shape_val

特征:
- text: string
分割:
- val: 300个样本, 16535字节
下载大小: 8641字节
数据集大小: 16535字节

shape_val_seen

特征:
- text: string
分割:
- val_seen: 200个样本, 9317字节
下载大小: 4904字节
数据集大小: 9317字节

shape_val_unseen

特征:
- text: string
分割:
- val_unseen: 100个样本, 7218字节
下载大小: 5038字节
数据集大小: 7218字节

spatial_train

特征:
- text: string
分割:
- train: 700个样本, 22964字节
下载大小: 8671字节
数据集大小: 22964字节

spatial_val

特征:
- text: string
分割:
- val: 300个样本, 9815字节
下载大小: 4353字节
数据集大小: 9815字节

texture_train

特征:
- text: string
分割:
- train: 700个样本, 33189字节
下载大小: 13122字节
数据集大小: 33189字节

texture_val

特征:
- text: string
分割:
- val: 300个样本, 14813字节
下载大小: 6766字节
数据集大小: 14813字节

texture_val_seen

特征:
- text: string
分割:
- val_seen: 200个样本, 7775字节
下载大小: 3581字节
数据集大小: 7775字节

texture_val_unseen

特征:
- text: string
分割:
- val_unseen: 100个样本, 7038字节
下载大小: 4238字节
数据集大小: 7038字节

数据集文件路径

3d_spatial_train

分割: spatial_train
路径: 3d_spatial_train/spatial_train-*

3d_spatial_val

分割: spatial_val
路径: 3d_spatial_val/spatial_val-*

color_train

分割: train
路径: color_train/train-*

color_val

分割: val
路径: color_val/val-*

color_val_seen

分割: val_seen
路径: color_val_seen/val_seen-*

color_val_unseen

分割: val_unseen
路径: color_val_unseen/val_unseen-*

complex_train

分割: train
路径: complex_train/train-*

complex_train_action

分割: train_action
路径: complex_train_action/train_action-*

complex_train_spatial

分割: train_spatial
路径: complex_train_spatial/train_spatial-*

complex_train_spatialaction

分割: train_spatialaction
路径: complex_train_spatialaction/train_spatialaction-*

complex_val

分割: val
路径: complex_val/val-*

complex_val_action

分割: val_action
路径: complex_val_action/val_action-*

complex_val_spatial

分割: val_spatial
路径: complex_val_spatial/val_spatial-*

complex_val_spatialaction

分割: val_spatialaction
路径: complex_val_spatialaction/val_spatialaction-*

non_spatial_train

分割: spatial_train
路径: non_spatial_train/spatial_train-*

non_spatial_val

分割: spatial_val
路径: non_spatial_val/spatial_val-*

numeracy_train

分割: train
路径: numeracy_train/train-*

numeracy_val

分割: val
路径: numeracy_val/val-*

shape_train

分割: train
路径: shape_train/train-*

shape_val

分割: val
路径: shape_val/val-*

shape_val_seen

分割: val_seen
路径: shape_val_seen/val_seen-*

shape_val_unseen

分割: val_unseen
路径: shape_val_unseen/val_unseen-*

spatial_train

分割: train
路径: spatial_train/train-*

spatial_val

分割: val
路径: spatial_val/val-*

texture_train

分割: train
路径: texture_train/train-*

texture_val

分割: val
路径: texture_val/val-*

texture_val_seen

分割: val_seen
路径: texture_val_seen/val_seen-*

texture_val_unseen

分割: val_unseen
路径: texture_val_unseen/val_unseen-*

许可证

许可证: MIT

任务类别

任务类别: text-to-image

语言

语言: en

t2i-compbench数据集的构建过程基于GitHub仓库中的文本文件，通过Python脚本从指定目录下载并整理这些文件。首先，使用GitHub API获取目录内容，筛选出以.txt结尾的文件并下载到本地。随后，利用Hugging Face的API将这些文件上传至Hub，并根据文件名中的关键词进行配置和分割。这一过程确保了数据集的完整性和可访问性，同时保留了原始数据的结构和内容。

使用方法

使用t2i-compbench数据集时，首先需安装`datasets`库，然后通过`load_dataset`函数加载特定配置和分割。例如，加载`spatial_val`配置的验证集时，可直接指定配置名称和分割名称。加载后的数据集以文本形式呈现，可直接用于模型训练或评估。通过这种方式，研究人员能够灵活地选择所需的数据子集，快速开展实验并验证模型性能。

背景与挑战

背景概述

T2I-CompBench数据集由Kaiyi Huang等研究人员于2023年创建，旨在为开放世界组合文本到图像生成提供一个全面的基准测试平台。该数据集由多个子集构成，涵盖了3D空间、颜色、形状、纹理等多个维度，旨在评估和提升文本到图像生成模型在复杂场景下的表现。该数据集的发布为相关领域的研究提供了重要的实验基础，推动了文本到图像生成技术的进一步发展。

当前挑战

T2I-CompBench数据集在解决文本到图像生成领域的复杂组合问题时面临多重挑战。首先，模型需要准确理解并生成包含多种视觉元素的复杂场景，这对模型的语义理解和图像生成能力提出了极高要求。其次，数据集的构建过程中，如何确保文本描述与图像内容的高度一致性，以及如何平衡不同维度的数据分布，都是构建过程中需要克服的技术难题。此外，数据集的多样性和复杂性也对模型的泛化能力和鲁棒性提出了更高的要求。

常用场景

经典使用场景

在文本到图像生成领域，t2i-compbench数据集被广泛用于评估和优化生成模型在复杂场景下的表现。通过提供多样化的文本描述，该数据集能够帮助研究人员测试模型在处理空间关系、颜色、形状和纹理等复杂属性时的能力。

解决学术问题

t2i-compbench数据集解决了文本到图像生成领域中模型在处理复杂组合属性时的性能评估问题。通过提供丰富的文本描述和对应的图像生成任务，该数据集为研究人员提供了一个标准化的测试平台，推动了生成模型在开放世界场景中的技术进步。

实际应用

在实际应用中，t2i-compbench数据集被用于开发和优化广告设计、虚拟现实和游戏开发中的图像生成系统。通过利用该数据集，开发者能够创建出更加符合用户描述的高质量图像，提升用户体验和产品竞争力。

数据集最近研究

最新研究方向

在文本到图像生成领域，t2i-compbench数据集的最新研究方向聚焦于开放世界组合生成能力的评估与优化。随着生成模型如DALL-E和Stable Diffusion的快速发展，如何提升模型在复杂场景下的组合生成能力成为研究热点。该数据集通过多维度的文本描述，涵盖了颜色、形状、纹理、空间关系等复杂组合，为模型在开放世界中的生成能力提供了全面的测试基准。近期研究进一步探索了模型在未见过的组合场景中的泛化能力，以及如何通过多模态预训练提升生成图像的语义一致性和细节表现。这些研究不仅推动了文本到图像生成技术的进步，也为实际应用如虚拟现实、广告设计等提供了技术支撑。

以上内容由遇见数据集搜集并总结生成

HAM10000

HAM10000数据集是一个全面收集的皮肤镜图像集合，用于皮肤病变分类，广泛应用于医学影像和机器学习领域。该数据集包含多种皮肤病变，旨在推动皮肤病学研究，特别是皮肤癌的诊断。数据集由10,000张高分辨率的皮肤病变图像组成，来源多样，有助于训练稳健的机器学习模型，使其能够很好地泛化到未见过的数据。数据集的主要挑战是其显著的不平衡性。

github2024-07-27 更新26840

Digital Typhoon

Digital Typhoon数据集是由日本国立情报学研究所创建的，包含自1978年至2022年共44个台风季节的189,364张卫星图像。该数据集旨在为机器学习模型提供长期时空数据基准，特别适用于深度学习模型的分类和回归任务。数据集通过Lambert等面积投影技术处理，确保图像质量，并解决了传感器噪声、数据缺失和长期传感器校准等数据质量问题。该数据集的应用领域包括气象分析、社会影响评估和气候变化

arXiv2023-11-05 更新22060

中国车牌识别数据集（7类，33万张）

这是一个高质量、平衡的中国车牌识别数据集，包含了33万张各类中国车牌的图片。数据集经过精心设计，确保了图像质量的优秀和大部分各类车牌类型的平衡分布。这个数据集非常适合用于训练和评估车牌识别模型。

魔搭社区2026-07-15 更新20700

MIMII数据集

MIMII数据集是由日立有限公司研究与开发集团创建的，专注于工业机器异常声音检测的数据集。该数据集包含26,092个正常操作条件下的声音文件，涵盖阀门、泵、风扇和滑轨四种机器类型。数据集的创建过程中，使用了TAMAGO-03麦克风阵列进行声音采集，并在多个真实工厂环境中混合背景噪声以模拟实际环境。MIMII数据集主要用于机器学习和信号处理社区开发自动化设施维护系统，特别是在无监督学习场景下检测机器

arXiv2019-09-20 更新26031

腾讯词向量（Tencent AI Lab Embedding Corpus for Chinese Words and Phrases）

这些语料库的最新版本提供了100维度和200维度的向量表示形式，也就是嵌入，适用于中文和英文。具体来说，有超过1200万个中文单词和短语以及650万个英语单词和短语，它们是在大规模高质量数据上进行预先培训的。这些向量捕获单词和短语的语义含义，可以广泛应用于许多下游任务 (例如，命名实体识别和文本分类) 以及进一步的研究中。

OpenDataLab2026-07-12 更新20960

t2i-compbench

T2I-CompBench 数据集概述

数据集配置

3d_spatial_train

3d_spatial_val

color_train

color_val

color_val_seen

color_val_unseen

complex_train

complex_train_action

complex_train_spatial

complex_train_spatialaction

complex_val

complex_val_action

complex_val_spatial

complex_val_spatialaction

non_spatial_train

non_spatial_val

numeracy_train

numeracy_val

shape_train

shape_val

shape_val_seen

shape_val_unseen

spatial_train

spatial_val

texture_train

texture_val

texture_val_seen

texture_val_unseen

数据集文件路径

3d_spatial_train

3d_spatial_val

color_train

color_val

color_val_seen

color_val_unseen

complex_train

complex_train_action

complex_train_spatial

complex_train_spatialaction

complex_val

complex_val_action

complex_val_spatial

complex_val_spatialaction

non_spatial_train

non_spatial_val

numeracy_train

numeracy_val

shape_train

shape_val

shape_val_seen

shape_val_unseen

spatial_train

spatial_val

texture_train

texture_val

texture_val_seen

texture_val_unseen

许可证

任务类别

语言

标签