NearID-Flux
收藏Hugging Face2026-04-03 更新2026-04-04 收录
下载链接:
https://huggingface.co/datasets/Aleksandar/NearID-Flux
下载链接
链接失效反馈官方服务:
资源简介:
NearID-Flux 数据集是 NearID 项目的一部分,包含通过 FLUX.1 修复生成的近身份干扰物,分辨率为 512×512。该数据集旨在通过语义相似但不同的实例(放置在参考图像的完全相同背景上)来学习身份表示,从而消除上下文捷径并隔离身份作为唯一的判别信号。每个样本包含最多 3 个干扰图像(nimg1、nimg2、nimg3),这些图像是通过 FLUX.1 修复在相同背景下生成的。数据集结构包括样本 ID、对象类别、类别描述、干扰图像、生成提示和质量标签等字段。该数据集适用于图像特征提取和图像到图像任务,特别适用于身份嵌入和度量学习。数据集发布在 CC-BY-4.0 许可下,并需要引用 NearID 和 SynCD 相关论文。
创建时间:
2026-04-02
原始信息汇总
NearID-Flux 数据集概述
数据集基本信息
- 数据集名称: NearID-Flux (Near-Identity Distractors)
- 托管地址: https://huggingface.co/datasets/Aleksandar/NearID-Flux
- 语言: 英语
- 许可证: CC-BY-4.0
- 数据规模: 10K < n < 100K
- 任务类别: 图像特征提取、图像到图像
- 标签: nearid, near-identity-distractors, identity-embedding, inpainting, synthetic, metric-learning
数据集描述
该数据集包含通过 FLUX.1 修复技术生成的 近身份干扰项,分辨率为 512×512,是 NearID 项目的一部分。NearID 引入了一个使用近身份干扰项进行身份表示学习的框架:这些干扰项是语义相似但不同的实例,被放置在与参考图像完全相同的背景上。这种方法消除了上下文捷径,并将身份隔离为唯一的判别信号。
每个样本包含最多 3 张干扰图像 (nimg1, nimg2, nimg3):这些是不同的、但视觉上相似的实例,被修复到与基础数据集 Aleksandar/NearID 中对应锚点图像 完全相同的背景/上下文 中。这些干扰项用于训练和评估能够区分真实身份与上下文捷径的身份嵌入模型。
数据集结构
| 列名 | 类型 | 描述 |
|---|---|---|
id |
int64 | 样本ID(与基础 NearID 数据集匹配) |
category |
string | 对象类别 (rigid) |
category_description |
string | 对象的自然语言描述 |
nimg1, nimg2, nimg3 |
image | 近身份干扰图像(每个样本最多3张) |
n_images |
int64 | 有效干扰图像的数量 |
objaverse_id |
string | 源 Objaverse 对象标识符 |
prompts1, prompts2, prompts3 |
string | 每个干扰项的生成提示词 |
quality |
string | 质量标签 |
数据划分
- train: 训练集
干扰项生成方法
- 为基础 NearID 数据集中的每个锚点身份,检索一个语义相似但 不同 的对象实例。
- 使用 FLUX.1 修复技术 将干扰项实例修复到与锚点 相同的背景 中。
- 分辨率:512×512 像素。
所有 NearID 数据集系列
| 数据集 | 描述 | 分辨率 |
|---|---|---|
| Aleksandar/NearID | 多视角正样本(锚点 + 正样本视角) | 基础分辨率 |
| Aleksandar/NearID-Flux | 通过 FLUX.1 修复生成的近身份干扰项 | 512×512 |
| Aleksandar/NearID-Flux_1024 | 通过 FLUX.1 修复生成的近身份干扰项 | 1024×1024 |
| Aleksandar/NearID-FluxC | 通过 FLUX.1 Canny 引导修复生成的近身份干扰项 | 512×512 |
| Aleksandar/NearID-FluxC_1024 | 通过 FLUX.1 Canny 引导修复生成的近身份干扰项 | 1024×1024 |
| Aleksandar/NearID-PowerPaint | 通过 PowerPaint 修复生成的近身份干扰项 | 512×512 |
| Aleksandar/NearID-Qwen | 通过基于 Qwen 的修复生成的近身份干扰项 | 512×512 |
| Aleksandar/NearID-Qwen_1328 | 通过基于 Qwen 的修复生成的近身份干扰项 | 1328×1328 |
| Aleksandar/NearID-SDXL | 通过 Stable Diffusion XL 修复生成的近身份干扰项 | 512×512 |
| Aleksandar/NearID-SDXL_1024 | 通过 Stable Diffusion XL 修复生成的近身份干扰项 | 1024×1024 |
相关资源
- 模型: Aleksandar/nearid-siglip2 — NearID 身份嵌入模型
- 论文: NearID: Identity Representation Learning via Near-identity Distractors
- 代码: https://github.com/Gorluxor/NearID
- 项目主页: https://gorluxor.github.io/NearID/
许可证与归属
该数据集根据 CC-BY-4.0 许可证发布。它源自 SynCD 数据集(MIT 许可证,版权所有 2022 SynCD)。如果使用此数据集,请同时引用 NearID 和 SynCD。
引用
bibtex @article{cvejic2026nearid, title={NearID: Identity Representation Learning via Near-identity Distractors}, author={Cvejic, Aleksandar and Abdal, Rameen and Eldesokey, Abdelrahman and Ghanem, Bernard and Wonka, Peter} }
搜集汇总
数据集介绍

构建方式
在计算机视觉领域,身份表征学习旨在捕捉对象的本质特征,而NearID-Flux数据集为此提供了精心构建的负样本资源。该数据集的构建始于基础数据集NearID中的锚点身份,针对每个锚点,检索语义相似但本质不同的对象实例作为干扰项。随后,利用先进的FLUX.1修复模型,将这些干扰项实例精确地嵌入到与锚点图像完全相同的背景环境中,生成分辨率为512×512像素的图像。这一过程确保了背景上下文的一致性,从而迫使模型必须专注于身份本身的差异进行学习,有效消除了环境线索带来的捷径效应。
特点
NearID-Flux数据集的核心特征在于其提供的“近身份干扰项”,这些图像在语义上与锚点高度相似,却代表着不同的实体,被置于完全一致的背景之下。数据集结构清晰,每条样本包含至多三个干扰图像,并附有对应的生成提示词、对象类别描述及质量标签。其图像均以标准格式存储,便于直接用于模型训练与评估。作为NearID项目系列的一部分,该数据集专门提供了通过FLUX.1模型生成的干扰项,与其他采用不同生成模型或分辨率的版本共同构成了一个多层次、多方法的身份学习研究资源体系。
使用方法
该数据集主要用于训练和评估能够区分真实身份与上下文干扰的身份嵌入模型。研究人员可通过Hugging Face的`datasets`库直接加载本数据集,通常需与基础数据集NearID配合使用,以构成完整的锚点-正样本-负样本三元组。在具体应用中,模型将学习从锚点图像和共享背景的干扰项图像中提取特征,其优化目标在于使锚点与正样本的特征表示相互接近,同时与干扰项的特征表示相互远离。这种使用方式直接支撑了度量学习与对比学习框架,为推进鲁棒性身份识别技术提供了关键的数据基础。
背景与挑战
背景概述
NearID-Flux数据集诞生于2026年,由阿卜杜拉国王科技大学(KAUST)与Snap Research的研究团队联合构建,旨在推动身份表征学习领域的发展。该数据集的核心研究问题聚焦于如何从视觉数据中剥离背景等上下文捷径,从而纯粹地学习对象的身份特征。通过引入“近身份干扰项”这一创新概念,即在完全相同的背景上嵌入语义相似但身份不同的对象实例,数据集为模型训练提供了高度可控的对比样本。这一方法论革新对计算机视觉中的度量学习、图像特征提取等方向产生了深远影响,为解决身份嵌入中的背景依赖问题提供了关键数据支撑。
当前挑战
该数据集致力于解决身份表征学习中的核心挑战,即模型容易依赖背景、光照等上下文线索而非对象本身的身份特征进行判别。构建过程中的挑战同样显著:首先,生成语义相似但身份不同的“近身份干扰项”需要精细的语义控制与检索策略;其次,利用FLUX.1等修复模型将干扰项无缝嵌入至与锚点完全一致的背景中,对生成模型的保真度与一致性提出了极高要求;最后,确保生成图像的质量与多样性,并建立与基础数据集的精确对应关系,构成了数据构建的复杂性。
常用场景
经典使用场景
在计算机视觉的身份表征学习领域,NearID-Flux数据集通过提供语义相似但身份不同的近身份干扰项,为模型训练与评估构建了精准的基准。该数据集的核心应用场景在于训练身份嵌入模型,使其能够在完全一致的背景环境下,仅依据对象本身的身份特征进行区分,从而有效剥离上下文信息带来的干扰。这一设计使得模型能够专注于学习纯粹的身份判别信号,为身份识别、物体重识别等任务提供了高质量的负样本对。
衍生相关工作
围绕NearID-Flux数据集,已衍生出一系列重要的研究工作。其核心框架催生了专用的身份嵌入模型nearid-siglip2,该模型在多个基准测试中展现了优越性能。同时,基于FLUX.1修复技术生成干扰项的方法,启发了对多种图像修复模型(如PowerPaint、Qwen、SDXL)在身份保持能力上的系统性比较研究。这些工作共同构成了一个从数据构建、模型训练到评估验证的完整技术体系,持续推动着身份表征学习领域的发展。
数据集最近研究
最新研究方向
在计算机视觉的身份表征学习领域,NearID-Flux数据集通过引入近身份干扰物,推动了模型对身份本质特征的精准提取。该数据集利用FLUX.1修复技术生成语义相似但身份不同的干扰图像,并置于相同背景中,有效消除了上下文捷径,使身份成为唯一的判别信号。这一方法正引领着无偏身份嵌入模型的前沿探索,尤其在细粒度识别和跨模态对齐任务中展现出潜力。随着生成式人工智能的迅猛发展,基于合成数据的身份学习已成为热点,NearID-Flux为评估模型在复杂场景下的鲁棒性提供了基准,对提升自动驾驶、生物特征识别等应用的可靠性具有深远意义。
以上内容由遇见数据集搜集并总结生成



