NearID-Flux

Hugging Face2026-04-03 更新2026-04-04 收录

下载链接：

https://huggingface.co/datasets/Aleksandar/NearID-Flux

下载链接

链接失效反馈

官方服务：

资源简介：

NearID-Flux 数据集是 NearID 项目的一部分，包含通过 FLUX.1 修复生成的近身份干扰物，分辨率为 512×512。该数据集旨在通过语义相似但不同的实例（放置在参考图像的完全相同背景上）来学习身份表示，从而消除上下文捷径并隔离身份作为唯一的判别信号。每个样本包含最多 3 个干扰图像（nimg1、nimg2、nimg3），这些图像是通过 FLUX.1 修复在相同背景下生成的。数据集结构包括样本 ID、对象类别、类别描述、干扰图像、生成提示和质量标签等字段。该数据集适用于图像特征提取和图像到图像任务，特别适用于身份嵌入和度量学习。数据集发布在 CC-BY-4.0 许可下，并需要引用 NearID 和 SynCD 相关论文。

创建时间：

2026-04-02

原始信息汇总

NearID-Flux 数据集概述

数据集基本信息

数据集名称: NearID-Flux (Near-Identity Distractors)
托管地址: https://huggingface.co/datasets/Aleksandar/NearID-Flux
语言: 英语
许可证: CC-BY-4.0
数据规模: 10K < n < 100K
任务类别: 图像特征提取、图像到图像
标签: nearid, near-identity-distractors, identity-embedding, inpainting, synthetic, metric-learning

数据集描述

该数据集包含通过 FLUX.1 修复技术生成的 近身份干扰项，分辨率为 512×512，是 NearID 项目的一部分。NearID 引入了一个使用近身份干扰项进行身份表示学习的框架：这些干扰项是语义相似但不同的实例，被放置在与参考图像完全相同的背景上。这种方法消除了上下文捷径，并将身份隔离为唯一的判别信号。

每个样本包含最多 3 张干扰图像 (nimg1, nimg2, nimg3)：这些是不同的、但视觉上相似的实例，被修复到与基础数据集 Aleksandar/NearID 中对应锚点图像 完全相同的背景/上下文 中。这些干扰项用于训练和评估能够区分真实身份与上下文捷径的身份嵌入模型。

数据集结构

列名	类型	描述
`id`	int64	样本ID（与基础 NearID 数据集匹配）
`category`	string	对象类别 (`rigid`)
`category_description`	string	对象的自然语言描述
`nimg1`, `nimg2`, `nimg3`	image	近身份干扰图像（每个样本最多3张）
`n_images`	int64	有效干扰图像的数量
`objaverse_id`	string	源 Objaverse 对象标识符
`prompts1`, `prompts2`, `prompts3`	string	每个干扰项的生成提示词
`quality`	string	质量标签

数据划分

train: 训练集

干扰项生成方法

为基础 NearID 数据集中的每个锚点身份，检索一个语义相似但不同的对象实例。
使用 FLUX.1 修复技术 将干扰项实例修复到与锚点 相同的背景 中。
分辨率：512×512 像素。

所有 NearID 数据集系列

数据集	描述	分辨率
Aleksandar/NearID	多视角正样本（锚点 + 正样本视角）	基础分辨率
Aleksandar/NearID-Flux	通过 FLUX.1 修复生成的近身份干扰项	512×512
Aleksandar/NearID-Flux_1024	通过 FLUX.1 修复生成的近身份干扰项	1024×1024
Aleksandar/NearID-FluxC	通过 FLUX.1 Canny 引导修复生成的近身份干扰项	512×512
Aleksandar/NearID-FluxC_1024	通过 FLUX.1 Canny 引导修复生成的近身份干扰项	1024×1024
Aleksandar/NearID-PowerPaint	通过 PowerPaint 修复生成的近身份干扰项	512×512
Aleksandar/NearID-Qwen	通过基于 Qwen 的修复生成的近身份干扰项	512×512
Aleksandar/NearID-Qwen_1328	通过基于 Qwen 的修复生成的近身份干扰项	1328×1328
Aleksandar/NearID-SDXL	通过 Stable Diffusion XL 修复生成的近身份干扰项	512×512
Aleksandar/NearID-SDXL_1024	通过 Stable Diffusion XL 修复生成的近身份干扰项	1024×1024

许可证与归属

引用

bibtex @article{cvejic2026nearid, title={NearID: Identity Representation Learning via Near-identity Distractors}, author={Cvejic, Aleksandar and Abdal, Rameen and Eldesokey, Abdelrahman and Ghanem, Bernard and Wonka, Peter} }

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，身份表征学习旨在捕捉对象的本质特征，而NearID-Flux数据集为此提供了精心构建的负样本资源。该数据集的构建始于基础数据集NearID中的锚点身份，针对每个锚点，检索语义相似但本质不同的对象实例作为干扰项。随后，利用先进的FLUX.1修复模型，将这些干扰项实例精确地嵌入到与锚点图像完全相同的背景环境中，生成分辨率为512×512像素的图像。这一过程确保了背景上下文的一致性，从而迫使模型必须专注于身份本身的差异进行学习，有效消除了环境线索带来的捷径效应。

特点

NearID-Flux数据集的核心特征在于其提供的“近身份干扰项”，这些图像在语义上与锚点高度相似，却代表着不同的实体，被置于完全一致的背景之下。数据集结构清晰，每条样本包含至多三个干扰图像，并附有对应的生成提示词、对象类别描述及质量标签。其图像均以标准格式存储，便于直接用于模型训练与评估。作为NearID项目系列的一部分，该数据集专门提供了通过FLUX.1模型生成的干扰项，与其他采用不同生成模型或分辨率的版本共同构成了一个多层次、多方法的身份学习研究资源体系。

使用方法

该数据集主要用于训练和评估能够区分真实身份与上下文干扰的身份嵌入模型。研究人员可通过Hugging Face的`datasets`库直接加载本数据集，通常需与基础数据集NearID配合使用，以构成完整的锚点-正样本-负样本三元组。在具体应用中，模型将学习从锚点图像和共享背景的干扰项图像中提取特征，其优化目标在于使锚点与正样本的特征表示相互接近，同时与干扰项的特征表示相互远离。这种使用方式直接支撑了度量学习与对比学习框架，为推进鲁棒性身份识别技术提供了关键的数据基础。

背景与挑战

背景概述

NearID-Flux数据集诞生于2026年，由阿卜杜拉国王科技大学（KAUST）与Snap Research的研究团队联合构建，旨在推动身份表征学习领域的发展。该数据集的核心研究问题聚焦于如何从视觉数据中剥离背景等上下文捷径，从而纯粹地学习对象的身份特征。通过引入“近身份干扰项”这一创新概念，即在完全相同的背景上嵌入语义相似但身份不同的对象实例，数据集为模型训练提供了高度可控的对比样本。这一方法论革新对计算机视觉中的度量学习、图像特征提取等方向产生了深远影响，为解决身份嵌入中的背景依赖问题提供了关键数据支撑。

当前挑战

该数据集致力于解决身份表征学习中的核心挑战，即模型容易依赖背景、光照等上下文线索而非对象本身的身份特征进行判别。构建过程中的挑战同样显著：首先，生成语义相似但身份不同的“近身份干扰项”需要精细的语义控制与检索策略；其次，利用FLUX.1等修复模型将干扰项无缝嵌入至与锚点完全一致的背景中，对生成模型的保真度与一致性提出了极高要求；最后，确保生成图像的质量与多样性，并建立与基础数据集的精确对应关系，构成了数据构建的复杂性。

常用场景

经典使用场景

在计算机视觉的身份表征学习领域，NearID-Flux数据集通过提供语义相似但身份不同的近身份干扰项，为模型训练与评估构建了精准的基准。该数据集的核心应用场景在于训练身份嵌入模型，使其能够在完全一致的背景环境下，仅依据对象本身的身份特征进行区分，从而有效剥离上下文信息带来的干扰。这一设计使得模型能够专注于学习纯粹的身份判别信号，为身份识别、物体重识别等任务提供了高质量的负样本对。

衍生相关工作

围绕NearID-Flux数据集，已衍生出一系列重要的研究工作。其核心框架催生了专用的身份嵌入模型nearid-siglip2，该模型在多个基准测试中展现了优越性能。同时，基于FLUX.1修复技术生成干扰项的方法，启发了对多种图像修复模型（如PowerPaint、Qwen、SDXL）在身份保持能力上的系统性比较研究。这些工作共同构成了一个从数据构建、模型训练到评估验证的完整技术体系，持续推动着身份表征学习领域的发展。

数据集最近研究