NearID-Qwen_1328

Hugging Face2026-04-03 更新2026-04-04 收录

下载链接：

https://huggingface.co/datasets/Aleksandar/NearID-Qwen_1328

下载链接

链接失效反馈

官方服务：

资源简介：

NearID-Qwen_1328 数据集包含通过基于 Qwen 的图像修复技术生成的近身份干扰项，分辨率为 1328×1328，是 NearID 项目的一部分。每个样本包含最多 3 个干扰图像（nimg1、nimg2、nimg3），这些图像是通过在基础 NearID 数据集的相同背景/上下文中修复不同但视觉上相似的实例生成的。这些干扰项用于训练和评估能够区分真实身份与上下文捷径的身份嵌入模型。数据集结构包括样本 ID、对象类别、类别描述、干扰图像、图像数量、源 Objaverse 对象标识符、生成提示和质量标签等字段。该数据集适用于身份表示学习和度量学习任务，发布在 CC-BY-4.0 许可下。

创建时间：

2026-04-02

原始信息汇总

NearID-Qwen_1328 数据集概述

基本描述

NearID-Qwen_1328 是一个包含近身份干扰项的数据集，这些干扰项通过基于Qwen的图像修复方法生成，分辨率为1328×1328。该数据集是NearID项目的一部分，旨在用于训练和评估能够区分真实身份与上下文捷径的身份嵌入模型。

数据集详情

语言: 英语
许可证: CC-BY-4.0
数据规模: 10K到100K之间
任务类别: 图像特征提取
标签: nearid, near-identity-distractors, identity-embedding, inpainting, synthetic, metric-learning
数据集特征:
- id: 样本ID（与基础NearID数据集匹配）
- category: 对象类别（固定为"rigid"）
- category_description: 对象的自然语言描述
- nimg1, nimg2, nimg3: 近身份干扰图像（每个样本最多3张）
- n_images: 有效干扰图像的数量
- objaverse_id: 源Objaverse对象标识符
- prompts1, prompts2, prompts3: 每个干扰项的生成提示
- quality: 质量标签
数据划分: 训练集

干扰项生成方法

为基础NearID数据集中的每个锚点身份检索一个语义相似但不同的对象实例。
使用基于Qwen的图像修复技术，将干扰项实例修复到与锚点相同的背景中。
生成图像的分辨率为1328×1328像素。

NearID系列数据集

数据集	描述	分辨率
Aleksandar/NearID	多视角正样本（锚点+正样本视图）	基础
Aleksandar/NearID-Flux	通过FLUX.1图像修复生成的近身份干扰项	512×512
Aleksandar/NearID-Flux_1024	通过FLUX.1图像修复生成的近身份干扰项	1024×1024
Aleksandar/NearID-FluxC	通过FLUX.1 Canny引导图像修复生成的近身份干扰项	512×512
Aleksandar/NearID-FluxC_1024	通过FLUX.1 Canny引导图像修复生成的近身份干扰项	1024×1024
Aleksandar/NearID-PowerPaint	通过PowerPaint图像修复生成的近身份干扰项	512×512
Aleksandar/NearID-Qwen	通过基于Qwen的图像修复生成的近身份干扰项	512×512
Aleksandar/NearID-Qwen_1328	通过基于Qwen的图像修复生成的近身份干扰项	1328×1328
Aleksandar/NearID-SDXL	通过Stable Diffusion XL图像修复生成的近身份干扰项	512×512
Aleksandar/NearID-SDXL_1024	通过Stable Diffusion XL图像修复生成的近身份干扰项	1024×1024

许可与引用

许可证: CC-BY-4.0 (https://creativecommons.org/licenses/by/4.0/)
来源: 本数据集衍生自SynCD数据集（MIT许可证，版权所有2022 SynCD）。
引用: bibtex @article{cvejic2026nearid, title={NearID: Identity Representation Learning via Near-identity Distractors}, author={Cvejic, Aleksandar and Abdal, Rameen and Eldesokey, Abdelrahman and Ghanem, Bernard and Wonka, Peter} }

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，身份表征学习旨在从图像中提取对象的本质特征，而NearID-Qwen_1328数据集为此提供了精心构建的负样本。该数据集的构建始于基础数据集NearID中的每个锚点身份，通过检索语义相似但不同的对象实例，并利用基于Qwen的图像修复技术，将这些干扰项精确嵌入到与锚点完全相同的背景环境中，最终生成分辨率高达1328×1328像素的高质量图像。这一过程确保了背景上下文的一致性，从而迫使模型必须依赖内在的身份特征而非环境线索进行区分，为身份嵌入模型的训练与评估奠定了坚实基础。

特点

该数据集的核心特点在于其提供的“近身份干扰项”，每个样本包含最多三个视觉上高度相似但身份不同的干扰图像，这些图像共享完全一致的背景与上下文。数据集覆盖了刚性物体类别，并附有自然语言描述与生成提示，确保了数据的丰富性与可解释性。其高分辨率特性进一步增强了图像的细节表现，为模型学习细微的身份差异提供了挑战。通过严格的质量标注与对象标识关联，数据集在保持视觉一致性的同时，有效剥离了背景依赖，专注于身份本身的表征学习。

使用方法

在身份嵌入学习的研究中，该数据集通常与基础正样本数据集NearID配合使用。研究人员可通过Hugging Face的datasets库直接加载，将本数据集提供的干扰项作为负样本，与基础数据集中的锚点-正样本对结合，构建用于度量学习或对比学习的训练与评估三元组。这种使用方式能够有效训练模型区分真实身份与视觉上极其相似的干扰项，从而提升模型在开放世界识别任务中的鲁棒性与泛化能力。数据集的结构化设计便于直接集成到现有机器学习流程中，支持身份表征学习的前沿探索。

背景与挑战

背景概述

在计算机视觉与表征学习领域，身份嵌入旨在从图像中提取对象的本质特征，从而区分不同实体。NearID-Qwen_1328数据集由阿卜杜拉国王科技大学（KAUST）与Snap Research的研究团队于2024年提出，其核心研究问题聚焦于解决模型在识别任务中过度依赖背景上下文而非对象内在属性的偏差。该数据集通过生成近身份干扰项，为训练和评估身份嵌入模型提供了精准的基准，推动了视觉表征学习向更鲁棒和泛化能力更强的方向发展。

当前挑战

该数据集致力于应对身份表征学习中的关键挑战，即模型易受背景信息干扰而忽略对象本质特征的问题。通过构建视觉高度相似但身份不同的干扰图像，迫使模型学习区分细微的身份差异。在构建过程中，挑战主要源于生成高质量且背景一致的近身份干扰项，这需要精确的语义检索与先进的Qwen修复技术，以确保干扰项与锚点共享相同背景，同时保持身份上的独立性，从而有效模拟真实世界中的识别难题。

常用场景

经典使用场景

在计算机视觉领域，身份表示学习旨在从图像中提取对象的本质特征，而NearID-Qwen_1328数据集为此提供了精心设计的评估基准。该数据集的核心应用场景在于训练和验证身份嵌入模型，通过呈现与锚点图像共享完全相同背景、但对象实例不同的近身份干扰项，迫使模型摒弃对上下文线索的依赖，专注于学习对象本身的身份特征。这种设置模拟了现实世界中对象识别所面临的挑战，即同一对象可能出现在多变环境中，而不同对象也可能共享相似背景。

实际应用

在实际应用中，该数据集所支撑的技术能够显著提升需要精确身份辨别的系统性能。例如，在电子商务领域，可用于构建更精准的商品搜索与推荐引擎，即使商品置于相同展示背景下，系统也能准确识别其独特属性。在安防监控与生物特征识别中，此类技术有助于在复杂场景下稳定追踪特定个体或物体，减少因环境相似性导致的误判。此外，它也为自动驾驶系统中的障碍物精确分类提供了重要的训练与评估资源。

衍生相关工作

围绕NearID-Qwen_1328及其系列数据集，已衍生出多项重要的研究工作。其核心论文《NearID: Identity Representation Learning via Near-identity Distractors》系统阐述了利用近身份干扰项学习身份表示的理论与方法。基于此，社区进一步探索了不同生成模型（如FLUX、PowerPaint、SDXL）在创建干扰项上的效果，形成了多分辨率、多方法的对比实验体系。这些工作共同深化了对身份嵌入模型鲁棒性的理解，并催生了如nearid-siglip2等专门优化的身份嵌入模型。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集