NearID-SDXL
收藏Hugging Face2026-04-03 更新2026-04-04 收录
下载链接:
https://huggingface.co/datasets/Aleksandar/NearID-SDXL
下载链接
链接失效反馈官方服务:
资源简介:
NearID-SDXL数据集包含通过Stable Diffusion XL修复生成的近身份干扰项,分辨率为512×512,是NearID项目的一部分。每个样本包含最多3个干扰图像(nimg1、nimg2、nimg3),这些图像通过修复技术嵌入到与基础NearID数据集中相应锚点完全相同的背景/上下文中。数据集旨在训练和评估能够区分真实身份与上下文捷径的身份嵌入模型。数据集结构包括样本ID、对象类别、类别描述、干扰图像、干扰图像数量、源Objaverse对象标识符、生成提示和质量标签等字段。数据集适用于图像特征提取和图像到图像任务,发布在CC-BY-4.0许可下。
创建时间:
2026-04-02
原始信息汇总
NearID-SDXL 数据集概述
数据集基本信息
- 数据集名称: NearID-SDXL (Near-Identity Distractors)
- 托管地址: https://huggingface.co/datasets/Aleksandar/NearID-SDXL
- 语言: 英语
- 许可证: CC-BY-4.0
- 数据规模: 10K 到 100K 之间
- 任务类别: 图像特征提取、图像到图像
- 标签: nearid, near-identity-distractors, identity-embedding, inpainting, synthetic, metric-learning
数据集描述
该数据集包含由 Stable Diffusion XL 修复模型 在 512×512 分辨率下生成的 近身份干扰项,是 NearID 项目的一部分。
每个样本包含最多 3 张干扰图像:这些图像在视觉上相似但属于不同实例,它们被修复到与基础数据集 Aleksandar/NearID 中对应锚点图像 完全相同的背景/上下文 中。这些干扰项用于训练和评估能够区分真实身份与上下文捷径的身份嵌入模型。
数据集结构
数据集包含以下特征(列):
| 特征名 | 数据类型 | 描述 |
|---|---|---|
id |
int64 | 样本 ID(与基础 NearID 数据集匹配) |
category |
string | 物体类别(rigid) |
category_description |
string | 物体的自然语言描述 |
nimg1, nimg2, nimg3 |
image | 近身份干扰图像(每个样本最多 3 张) |
n_images |
int64 | 有效干扰图像的数量 |
objaverse_id |
string | 源 Objaverse 物体标识符 |
prompts1, prompts2, prompts3 |
string | 每张干扰图像的生成提示词 |
quality |
string | 质量标签 |
数据集仅包含一个数据拆分:train。
干扰项生成方法
- 为基础 NearID 数据集中的每个锚点身份,检索一个语义相似但 不同 的物体实例。
- 使用 Stable Diffusion XL 修复模型 将干扰实例修复到与锚点 相同的背景 中。
- 生成分辨率为 512×512 像素。
此方法创建了一个受控测试:模型必须依赖内在的身份特征,而非背景上下文,来区分锚点与干扰项。
快速使用
python from datasets import load_dataset
加载此负样本源
ds = load_dataset("Aleksandar/NearID-SDXL")
加载基础正样本以获取锚点/正样本对
positives = load_dataset("Aleksandar/NearID")
NearID 系列数据集
| 数据集 | 描述 | 分辨率 |
|---|---|---|
| Aleksandar/NearID | 多视角正样本(锚点 + 正样本视角) | 基础分辨率 |
| Aleksandar/NearID-Flux | 通过 FLUX.1 修复生成的近身份干扰项 | 512×512 |
| Aleksandar/NearID-Flux_1024 | 通过 FLUX.1 修复生成的近身份干扰项 | 1024×1024 |
| Aleksandar/NearID-FluxC | 通过 FLUX.1 Canny 边缘引导修复生成的近身份干扰项 | 512×512 |
| Aleksandar/NearID-FluxC_1024 | 通过 FLUX.1 Canny 边缘引导修复生成的近身份干扰项 | 1024×1024 |
| Aleksandar/NearID-PowerPaint | 通过 PowerPaint 修复生成的近身份干扰项 | 512×512 |
| Aleksandar/NearID-Qwen | 通过基于 Qwen 的修复生成的近身份干扰项 | 512×512 |
| Aleksandar/NearID-Qwen_1328 | 通过基于 Qwen 的修复生成的近身份干扰项 | 1328×1328 |
| Aleksandar/NearID-SDXL | 通过 Stable Diffusion XL 修复生成的近身份干扰项 | 512×512 |
| Aleksandar/NearID-SDXL_1024 | 通过 Stable Diffusion XL 修复生成的近身份干扰项 | 1024×1024 |
相关资源
- 模型: Aleksandar/nearid-siglip2 — NearID 身份嵌入模型
- 论文: NearID: Identity Representation Learning via Near-identity Distractors
- 代码: github.com/Gorluxor/NearID
- 项目主页: https://gorluxor.github.io/NearID/
许可与引用
- 许可证: 本数据集基于 CC-BY-4.0 许可证发布。它源自 SynCD 数据集(MIT 许可证,版权所有 2022 SynCD)。
- 引用: 如果使用此数据集,请同时引用 NearID 和 SynCD。
bibtex @article{cvejic2026nearid, title={NearID: Identity Representation Learning via Near-identity Distractors}, author={Cvejic, Aleksandar and Abdal, Rameen and Eldesokey, Abdelrahman and Ghanem, Bernard and Wonka, Peter} }
搜集汇总
数据集介绍

构建方式
在计算机视觉领域,构建能够有效评估身份表征学习的数据集至关重要。NearID-SDXL数据集的构建过程始于基础NearID数据集中的锚点身份,针对每个锚点,系统检索语义相似但本质不同的物体实例作为干扰项。随后,利用Stable Diffusion XL图像修复技术,将这些干扰项实例精准嵌入与锚点完全相同的背景环境中,生成分辨率为512×512像素的图像。这一方法确保了背景上下文的一致性,从而迫使模型必须依赖物体内在的身份特征而非环境线索进行区分,为身份嵌入模型的训练与评估提供了高度受控的测试基准。
特点
该数据集的核心特征在于其精心设计的“近身份干扰项”。每个样本包含至多三张干扰图像,这些图像与锚点共享完全一致的背景,仅在主体物体身份上存在细微差异。数据集结构清晰,不仅提供了图像数据,还附带了物体类别、自然语言描述、生成提示词以及质量标签等丰富的元信息。这种设计使得数据集特别适用于需要模型摒弃上下文捷径、专注于学习鲁棒身份表征的度量学习与图像特征提取任务,为研究身份嵌入的判别能力提供了高质量的合成数据资源。
使用方法
为充分利用NearID-SDXL数据集进行研究,通常需要将其与基础的正样本数据集配合使用。研究者可通过Hugging Face的`datasets`库便捷加载本数据集,同时加载Aleksandar/NearID数据集以获取对应的锚点与正样本对。在实际应用中,本数据集提供的干扰项图像可作为难负样本,用于训练或评估身份嵌入模型。通过构建(锚点,正样本,干扰项)这样的三元组或更复杂的对比学习框架,可以迫使模型学习区分高度相似视觉实例之间的本质身份差异,从而提升模型在开放世界识别任务中的泛化与判别能力。
背景与挑战
背景概述
NearID-SDXL数据集是NearID项目的重要组成部分,由阿卜杜拉国王科技大学(KAUST)和Snap Research的研究团队于2024年联合创建,核心研究人员包括Aleksandar Cvejic等。该数据集旨在解决计算机视觉中身份表征学习的关键问题,即如何让模型从图像中提取并区分对象的本质身份特征,而非依赖背景或上下文等表面线索。通过利用Stable Diffusion XL模型进行图像修复,生成与锚点图像共享相同背景但身份不同的干扰项,为训练和评估鲁棒的身份嵌入模型提供了精准的测试基准,推动了细粒度识别与度量学习领域的发展。
当前挑战
该数据集致力于应对身份表征学习中的核心挑战:如何迫使模型摒弃对背景、光照或视角等上下文捷径的依赖,从而专注于学习对象内在的、不变的身份特征。这一挑战在开放世界的对象识别与验证任务中尤为突出,直接关系到模型的泛化能力与可靠性。在构建过程中,研究团队面临生成高质量近身份干扰项的技术难题,需确保生成的干扰项在视觉上与锚点高度相似,但身份本质不同,同时保持背景的严格一致,这要求对生成模型进行精细的控制与后处理,以平衡语义相似性与身份差异性。
常用场景
经典使用场景
在计算机视觉领域,身份表征学习旨在提取对象的本质特征,而NearID-SDXL数据集为此提供了关键资源。该数据集通过Stable Diffusion XL修复技术,为每个锚点图像生成视觉上相似但身份不同的干扰项,这些干扰项被嵌入到与锚点完全相同的背景中。研究人员利用这些精心构造的样本对,训练模型区分细微的身份差异,从而避免模型过度依赖上下文线索,专注于学习对象的固有身份特征。
实际应用
在现实应用中,精确的身份识别是许多系统的基石。NearID-SDXL所支持的技术可广泛应用于需要高精度对象辨别的场景,例如生物特征识别中的活体检测与防欺骗、电子商务中的商品真伪鉴别、工业质检中的缺陷分类,以及自动驾驶中对动态障碍物的持续追踪。通过提升模型在复杂、欺骗性环境下的判别能力,该数据集助力构建更可靠、安全的智能视觉系统。
衍生相关工作
围绕NearID-SDXL及其系列数据集,已催生了一系列重要的研究工作。其核心论文《NearID: Identity Representation Learning via Near-identity Distractors》系统阐述了利用近身份干扰项进行表征学习的框架。基于此,社区进一步探索了使用不同生成模型(如FLUX.1、Qwen)创建干扰项,并开发了专门的嵌入模型nearid-siglip2。这些工作共同深化了对生成式数据在度量学习中作用的理解,为构建更强大的身份嵌入模型开辟了新路径。
以上内容由遇见数据集搜集并总结生成



