NearID-FluxC

Hugging Face2026-04-03 更新2026-04-04 收录

下载链接：

https://huggingface.co/datasets/Aleksandar/NearID-FluxC

下载链接

链接失效反馈

官方服务：

资源简介：

NearID-FluxC 数据集包含通过 FLUX.1 Canny 引导修复生成的近身份干扰图像，分辨率为 512×512。该数据集是 NearID 项目的一部分，旨在为训练和评估身份嵌入模型提供数据支持。每个样本包含最多 3 个干扰图像（nimg1, nimg2, nimg3），这些图像与基础 NearID 数据集中的锚图像共享相同的背景/上下文，但视觉上相似的不同实例被修复到相同的背景中。数据集结构包括样本 ID、对象类别、类别描述、干扰图像、图像数量、源 Objaverse 对象标识符、生成提示和质量标签等字段。该数据集适用于身份嵌入学习、度量学习等任务，要求模型依赖内在身份特征而非背景上下文来区分锚图像与干扰图像。数据集基于 CC-BY-4.0 许可发布，并衍生自 SynCD 数据集（MIT 许可）。

创建时间：

2026-04-02

原始信息汇总

NearID-FluxC 数据集概述

数据集基本信息

数据集名称: NearID-FluxC (Near-Identity Distractors)
语言: 英语 (en)
许可证: CC-BY-4.0
数据规模: 10K<n<100K
任务类别: 图像特征提取 (image-feature-extraction)
标签: nearid, near-identity-distractors, identity-embedding, inpainting, synthetic, metric-learning
数据分割: train

数据集描述

该数据集包含通过 FLUX.1 Canny-guided inpainting 生成的 近身份干扰项，分辨率为 512×512，是 NearID 项目的一部分。每个样本包含最多 3 张干扰图像，这些图像被修复到与基础数据集 Aleksandar/NearID 中对应锚点完全相同的背景/上下文中，但视觉上相似的不同实例。这些干扰项用于训练和评估能够区分真实身份与上下文捷径的身份嵌入模型。

数据集结构

列名	数据类型	描述
id	int64	样本ID（与基础NearID数据集匹配）
category	string	对象类别（rigid）
category_description	string	对象的自然语言描述
nimg1, nimg2, nimg3	image	近身份干扰图像（每个样本最多3张）
n_images	int64	有效干扰图像的数量
objaverse_id	string	源Objaverse对象标识符
prompts1, prompts2, prompts3	string	每个干扰项的生成提示词
quality	string	质量标签

干扰项生成方法

为基础NearID数据集中的每个锚点身份检索语义相似但不同的对象实例。
使用 FLUX.1 Canny-guided inpainting 将干扰项实例修复到与锚点相同的背景中。
分辨率为 512×512 像素。

引用信息

如果使用此数据集，请引用NearID和SynCD。 bibtex @article{cvejic2026nearid, title={NearID: Identity Representation Learning via Near-identity Distractors}, author={Cvejic, Aleksandar and Abdal, Rameen and Eldesokey, Abdelrahman and Ghanem, Bernard and Wonka, Peter} }

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，构建能够有效评估身份嵌入模型的数据集至关重要。NearID-FluxC数据集的构建过程始于基础数据集NearID中的每个锚点身份，通过检索语义相似但不同的物体实例，为每个锚点生成干扰项。随后，利用FLUX.1 Canny引导的图像修复技术，将这些干扰项实例精确地嵌入到与锚点相同的背景环境中，生成分辨率为512×512像素的图像。这一方法确保了干扰项在视觉上与锚点高度相似，但身份不同，从而创建了一个受控的测试环境，迫使模型依赖内在身份特征而非背景上下文进行区分。

特点

NearID-FluxC数据集的核心特点在于其专注于提供近身份干扰项，这些干扰项通过先进的生成模型合成，与锚点共享完全一致的背景，但呈现不同的物体实例。数据集包含多达三个干扰图像，每个样本均配有详细的元数据，如物体类别、描述和生成提示，增强了数据的可解释性和实用性。其图像分辨率为512×512，确保了高质量的视觉输入，适用于训练和评估身份嵌入模型，特别是在需要区分细微身份差异的任务中，该数据集提供了标准化的基准。

使用方法

使用NearID-FluxC数据集时，研究者可首先通过Hugging Face的datasets库加载该数据集，作为负样本源。为了构建完整的训练或评估对，建议同时加载基础数据集NearID以获取正样本（锚点与正视图）。在实际应用中，该数据集可用于训练身份嵌入模型，通过对比学习区分锚点与干扰项，从而提升模型对身份特征的敏感度。此外，其结构化的数据格式便于集成到现有的机器学习流程中，支持图像特征提取和度量学习等任务，为计算机视觉研究提供了可靠的实验基础。

背景与挑战

背景概述

在计算机视觉与表征学习领域，身份嵌入模型的训练长期面临数据稀缺的困境，特别是缺乏能够精准区分细微视觉差异的负样本对。NearID-FluxC数据集应运而生，由阿卜杜拉国王科技大学（KAUST）与Snap Research的研究团队于2024年主导构建，其核心研究问题聚焦于如何通过合成生成的“近身份干扰项”来增强模型对物体本质特征的辨识能力，而非依赖背景上下文等捷径特征。该数据集作为NearID项目的重要组成部分，通过FLUX.1 Canny引导修复技术，在严格控制的相同背景中嵌入语义相似但身份不同的物体实例，为身份表征学习提供了高保真、结构化的评估基准，显著推动了细粒度识别与度量学习方向的发展。

当前挑战

该数据集旨在解决身份嵌入学习中的核心挑战，即模型易受背景、光照或视角等上下文线索误导，而难以捕捉物体内在的鉴别性特征。通过提供背景完全一致的近身份干扰图像，它迫使模型必须依赖细微的形态与纹理差异进行判别，从而提升了身份表征的鲁棒性与泛化能力。在构建过程中，研究团队面临的主要挑战在于如何生成视觉高度相似但身份严格不同的干扰实例，并确保其与原始锚点背景的无缝融合。这要求先进的生成模型具备精确的语义控制与图像修复能力，同时需维持数据的高视觉质量与多样性，以避免引入无关的合成伪影，确保评估结果的可靠性与科学性。

常用场景

经典使用场景

在计算机视觉领域，身份表示学习旨在从图像中提取能够唯一标识对象的特征，而NearID-FluxC数据集为此提供了精准的评估基准。该数据集通过FLUX.1 Canny引导修复技术，将语义相似但身份不同的干扰对象嵌入到与锚点图像完全相同的背景中，从而构建了高度可控的对比样本。研究者利用这些近身份干扰项，训练模型区分细微的身份差异，迫使模型依赖对象的内在特征而非上下文线索，这在度量学习和特征提取任务中成为经典范例。

实际应用

在实际应用中，NearID-FluxC数据集为需要高精度身份识别的系统提供了关键训练资源。例如，在智能监控中，系统必须从相似场景中区分不同个体；在电子商务领域，商品识别需排除背景干扰以准确匹配同类物品。该数据集生成的合成干扰项模拟了真实世界中的视觉混淆情况，使模型能够在复杂环境下保持识别稳定性，从而增强自动驾驶、机器人视觉及内容检索等系统的可靠性与泛化能力。

衍生相关工作

围绕NearID-FluxC数据集，衍生了一系列经典研究工作。原论文《NearID: Identity Representation Learning via Near-identity Distractors》提出了基于干扰项的身份表示学习框架，并训练了nearid-siglip2等嵌入模型。后续研究扩展了不同生成模型如Stable Diffusion XL和Qwen的干扰项构建，形成了多分辨率的数据集家族。这些工作共同深化了对身份特征解耦的理解，推动了合成数据在视觉表示学习中的应用，为领域设立了新的基准与方向。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集