NearID-FluxC_1024

Hugging Face2026-04-03 更新2026-04-04 收录

下载链接：

https://huggingface.co/datasets/Aleksandar/NearID-FluxC_1024

下载链接

链接失效反馈

官方服务：

资源简介：

NearID-FluxC_1024 数据集是 NearID 项目的一部分，包含通过 FLUX.1 Canny 引导修复生成的近身份干扰项，分辨率为 1024×1024。该数据集旨在用于训练和评估能够区分真实身份与上下文捷径的身份嵌入模型。每个样本包含最多 3 个干扰图像（nimg1, nimg2, nimg3），这些图像是通过将语义相似但不同的对象实例修复到与基础 NearID 数据集中相应锚点完全相同的背景/上下文中生成的。数据集结构包括样本 ID、对象类别、类别描述、干扰图像、有效干扰图像数量、源 Objaverse 对象标识符、每个干扰图像的生成提示和质量标签。该数据集适用于图像特征提取、身份嵌入学习和度量学习等任务。

创建时间：

2026-04-02

原始信息汇总

NearID-FluxC_1024 数据集概述

数据集基本信息

数据集名称: NearID-FluxC_1024 (Near-Identity Distractors)
语言: 英语 (en)
许可证: CC-BY-4.0
数据规模: 10K < n < 100K
任务类别: 图像特征提取 (image-feature-extraction)
标签: nearid, near-identity-distractors, identity-embedding, inpainting, synthetic, metric-learning

数据集描述

该数据集包含通过 FLUX.1 Canny-guided inpainting 方法生成的 近身份干扰项，分辨率为 1024×1024，是 NearID 项目的一部分。

每个样本包含最多3个干扰图像 (nimg1, nimg2, nimg3)：这些是不同的、但视觉上相似的实例，它们被修复到与基础数据集 Aleksandar/NearID 中相应锚点完全相同的背景/上下文中。这些干扰项用于训练和评估身份嵌入，以区分真实身份和上下文捷径。

数据集结构

列名	类型	描述
`id`	int64	样本ID（与基础NearID数据集匹配）
`category`	string	对象类别 (`rigid`)
`category_description`	string	对象的自然语言描述
`nimg1`, `nimg2`, `nimg3`	image	近身份干扰图像（每个样本最多3个）
`n_images`	int64	有效干扰图像的数量
`objaverse_id`	string	源Objaverse对象标识符
`prompts1`, `prompts2`, `prompts3`	string	每个干扰项的生成提示词
`quality`	string	质量标签

数据划分

train: 训练集

干扰项生成方法

为基础NearID数据集中的每个锚点身份，检索一个语义相似但不同的对象实例。
使用 FLUX.1 Canny-guided inpainting 将干扰实例修复到与锚点相同的背景中。
分辨率：1024×1024 像素。

这创建了一个受控测试：模型必须依赖内在的身份特征，而不是背景上下文，来区分锚点和干扰项。

NearID系列数据集

数据集	描述	分辨率
Aleksandar/NearID	多视角正样本（锚点 + 正视角）	基础
Aleksandar/NearID-Flux	通过FLUX.1修复生成的近身份干扰项	512×512
Aleksandar/NearID-Flux_1024	通过FLUX.1修复生成的近身份干扰项	1024×1024
Aleksandar/NearID-FluxC	通过FLUX.1 Canny-guided修复生成的近身份干扰项	512×512
Aleksandar/NearID-FluxC_1024	通过FLUX.1 Canny-guided修复生成的近身份干扰项	1024×1024
Aleksandar/NearID-PowerPaint	通过PowerPaint修复生成的近身份干扰项	512×512
Aleksandar/NearID-Qwen	通过基于Qwen的修复生成的近身份干扰项	512×512
Aleksandar/NearID-Qwen_1328	通过基于Qwen的修复生成的近身份干扰项	1328×1328
Aleksandar/NearID-SDXL	通过Stable Diffusion XL修复生成的近身份干扰项	512×512
Aleksandar/NearID-SDXL_1024	通过Stable Diffusion XL修复生成的近身份干扰项	1024×1024

许可证与归属

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，身份表征学习旨在提取对象的内在身份特征，而NearID-FluxC_1024数据集的构建为此提供了精准的负样本支持。该数据集基于NearID基础数据集中的锚点图像，通过检索语义相似但身份不同的对象实例，并利用FLUX.1模型结合Canny边缘引导的修复技术，将这些干扰项精确嵌入到与锚点完全相同的背景环境中，最终生成分辨率为1024×1024的高质量图像。这一构建过程确保了背景上下文的一致性，从而迫使模型必须依赖对象本身的身份特征进行区分，而非环境线索，为身份嵌入模型的训练与评估奠定了严谨的数据基础。

特点

该数据集的核心特点在于其生成的近身份干扰项具有高度的视觉相似性与背景一致性。每个样本包含最多三个干扰图像，它们与锚点共享完全相同的背景，仅在对象身份上存在细微差异，这为模型识别任务带来了极具挑战性的负例。数据集以1024×1024的高分辨率呈现，图像细节丰富，同时提供了每个干扰项对应的生成提示文本以及质量标签，便于研究者深入分析生成过程与数据特性。作为NearID项目系列的一部分，该数据集专门针对Canny引导的修复方法，为探索身份表征学习中的上下文无关性提供了标准化的评估资源。

使用方法

在身份嵌入模型的开发与评估中，NearID-FluxC_1024数据集可作为关键的负样本源使用。研究者可通过Hugging Face的datasets库直接加载该数据集，并与基础的正样本数据集NearID配对，构建包含锚点、正例和近身份干扰项的三元组训练数据。这种配对方式使模型能够在对比学习框架下，学习区分相同身份的不同视角与不同身份但背景相似的干扰项，从而提升身份特征的判别能力。数据集的结构清晰，包含图像、类别描述及生成提示等多模态信息，支持跨模态身份学习任务的拓展，为计算机视觉中的度量学习与鲁棒表征研究提供了实用工具。

背景与挑战

背景概述

NearID-FluxC_1024数据集是NearID项目的重要组成部分，由阿卜杜拉国王科技大学（KAUST）和Snap Research的研究团队于2024年创建，旨在推动身份表征学习领域的发展。该数据集的核心研究问题聚焦于如何让模型学会区分对象的本质身份特征与背景上下文等表面线索，从而提升身份嵌入模型的鲁棒性与泛化能力。通过生成高分辨率（1024×1024）的近身份干扰项，该数据集为评估和训练身份识别模型提供了严谨的基准，对计算机视觉中的度量学习、图像特征提取及合成数据生成等方向产生了显著影响。

当前挑战

该数据集致力于解决身份表征学习中的核心挑战，即模型容易依赖背景、光照或视角等环境捷径进行判断，而非捕捉对象内在的、不变的身份特征。构建过程中的主要挑战在于生成高质量且可控的近身份干扰项：需确保干扰项与锚点对象在语义上相似但身份不同，同时必须精确地将其嵌入到完全一致的背景环境中，以消除上下文偏差。这要求先进的生成模型（如FLUX.1 Canny引导修复技术）具备高度的可控性与视觉保真度，且整个流程需保持大规模数据生成的效率与一致性。

常用场景

经典使用场景

在计算机视觉领域，身份表征学习旨在提取对象的内在身份特征，而NearID-FluxC_1024数据集为此提供了精准的评估基准。该数据集通过FLUX.1 Canny引导修复技术，在1024×1024分辨率下生成近身份干扰项，这些干扰项与锚点图像共享完全相同的背景环境，仅对象身份存在细微差异。经典使用场景涉及训练和评估身份嵌入模型，迫使模型摒弃对上下文捷径的依赖，专注于学习鲁棒的身份判别特征，从而在度量学习与对比学习框架中实现更准确的相似性度量。

衍生相关工作

围绕该数据集衍生的经典工作主要包括新型身份嵌入架构的探索与评估协议的创新。例如，NearID项目提出的nearid-siglip2模型便是直接利用此类数据训练出的代表性身份嵌入器。相关研究进一步扩展至跨模态身份检索、少样本身份学习以及合成数据在表征学习中的有效性分析。这些工作不仅深化了对身份特征解耦的理解，也为生成式模型在构建诊断性数据集方面的应用开辟了新的研究方向。

数据集最近研究