five

NearID-Qwen

收藏
Hugging Face2026-04-03 更新2026-04-04 收录
下载链接:
https://huggingface.co/datasets/Aleksandar/NearID-Qwen
下载链接
链接失效反馈
官方服务:
资源简介:
NearID-Qwen 数据集包含通过基于 Qwen 的图像修复技术生成的近身份干扰项,分辨率为 512×512,是 NearID 项目的一部分。每个样本包含最多 3 个干扰图像(nimg1, nimg2, nimg3),这些图像是通过在基础 NearID 数据集中相同背景/上下文中修复不同但视觉上相似的实例生成的。这些干扰项用于训练和评估能够区分真实身份与上下文捷径的身份嵌入模型。数据集结构包括样本ID、对象类别、类别描述、干扰图像、有效干扰图像数量、源Objaverse对象标识符、生成提示和质量标签等字段。数据集适用于图像特征提取和度量学习任务,发布在 CC-BY-4.0 许可下,使用时需引用 NearID 和 SynCD。
创建时间:
2026-04-02
原始信息汇总

NearID-Qwen 数据集概述

数据集基本信息

  • 数据集名称:NearID-Qwen (Near-Identity Distractors)
  • 语言:英语
  • 许可协议:CC-BY-4.0
  • 数据规模:10K<n<100K
  • 任务类别:图像特征提取
  • 标签:nearid, near-identity-distractors, identity-embedding, inpainting, synthetic, metric-learning

数据集描述

该数据集包含通过基于Qwen的图像修复技术生成的近身份干扰项,分辨率为512×512。它是NearID项目的一部分。每个样本包含最多3个干扰图像,这些图像被修复到与基础数据集Aleksandar/NearID中对应锚点完全相同的背景/上下文中,但视觉相似的不同实例。这些干扰项用于训练和评估能够区分真实身份与上下文捷径的身份嵌入模型。

数据集结构

数据集包含一个“train”划分,其字段如下:

字段名 数据类型 描述
id int64 样本ID(与基础NearID数据集匹配)
category string 物体类别(rigid
category_description string 物体的自然语言描述
nimg1, nimg2, nimg3 image 近身份干扰图像(每个样本最多3个)
n_images int64 有效干扰图像的数量
objaverse_id string 源Objaverse物体标识符
prompts1, prompts2, prompts3 string 每个干扰项的生成提示词
quality string 质量标签

干扰项生成方法

  1. 为基础NearID数据集中的每个锚点身份检索一个语义相似但不同的物体实例。
  2. 使用基于Qwen的图像修复技术将干扰项实例修复到与锚点相同的背景中。
  3. 生成分辨率为512×512像素。

相关资源

  • 基础数据集:https://huggingface.co/datasets/Aleksandar/NearID
  • 相关模型:https://huggingface.co/Aleksandar/nearid-siglip2
  • 论文:https://huggingface.co/papers/2604.01973
  • 项目页面:https://gorluxor.github.io/NearID/
  • 代码仓库:https://github.com/Gorluxor/NearID

引用

若使用此数据集,请引用相关论文: bibtex @article{cvejic2026nearid, title={NearID: Identity Representation Learning via Near-identity Distractors}, author={Cvejic, Aleksandar and Abdal, Rameen and Eldesokey, Abdelrahman and Ghanem, Bernard and Wonka, Peter}, year={2026} }

搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉领域,针对身份嵌入学习的需求,NearID-Qwen数据集的构建采用了精密的合成方法。该数据集以基础NearID数据集中的锚点图像为起点,通过检索语义相似但实体不同的物体实例,并利用基于Qwen的图像修复技术,将这些干扰项无缝嵌入到与锚点完全相同的背景环境中。这一过程在512×512像素的分辨率下完成,确保了视觉上的高度一致性,从而创造出一种受控的对比场景,迫使模型必须依赖物体本身的内在身份特征,而非背景上下文线索来进行区分。
特点
NearID-Qwen数据集的核心特征在于其提供的“近身份干扰项”。每个数据样本最多包含三张干扰图像,这些图像在视觉上与锚点极为相似,但代表不同的物体实例,且共享完全一致的背景。数据集结构清晰,包含样本ID、物体类别、自然语言描述、干扰图像、生成提示词及质量标签等字段,为身份表示学习提供了高质量的负样本对。这种设计旨在挑战并提升模型在复杂视觉场景中捕捉本质身份信息的能力,避免其陷入依赖环境捷径的误区。
使用方法
该数据集主要用于训练和评估能够区分真实身份与上下文捷径的身份嵌入模型。研究人员可以结合基础NearID数据集提供的正样本对(锚点与正视图)一同使用,构建完整的对比学习任务。通过加载‘Aleksandar/NearID-Qwen’数据集,即可便捷地获取这些合成的高质量干扰项,用于模型训练或作为评估基准,以检验模型在排除背景干扰、聚焦物体本质身份方面的性能表现。
背景与挑战
背景概述
在计算机视觉领域,身份表示学习旨在从图像中提取能够唯一标识特定对象的特征,这一任务对于人脸识别、物体重识别等应用至关重要。NearID-Qwen数据集作为NearID项目的一部分,由阿卜杜拉国王科技大学(KAUST)和Snap Research的研究团队于2026年创建,其核心研究问题是解决模型在身份识别中过度依赖背景上下文而非内在身份特征的偏差。该数据集通过生成近身份干扰项,即在不同对象实例上保持完全相同背景的图像对,推动模型学习更具判别力的身份嵌入,从而提升视觉表示学习的鲁棒性和泛化能力。
当前挑战
NearID-Qwen数据集所针对的领域挑战在于,传统身份表示学习模型容易受到背景、光照或视角等上下文信息的干扰,导致其无法准确捕捉对象的本质身份特征。构建该数据集的过程亦面临多重挑战:一是需要精确检索语义相似但身份不同的对象实例,以确保干扰项与锚点对象在视觉上高度接近;二是利用Qwen修复模型将干扰项无缝嵌入到与锚点完全一致的背景中,这对生成模型的上下文理解与图像合成质量提出了极高要求;三是保持数据集的规模与多样性,以支持模型在复杂场景下的有效训练与评估。
常用场景
经典使用场景
在计算机视觉与度量学习领域,NearID-Qwen数据集为身份嵌入模型的训练与评估提供了关键资源。该数据集通过Qwen修复技术生成近身份干扰图像,这些图像在相同背景中嵌入与锚点对象语义相似但身份不同的实例,从而构建了高度受控的对比学习环境。研究者利用这些干扰项,能够迫使模型专注于对象的内在身份特征,而非依赖背景上下文等表面线索,进而优化身份表示的学习过程。
衍生相关工作
围绕NearID-Qwen数据集,已衍生出一系列经典研究工作。其核心项目NearID提出了基于近身份干扰的身份表示学习框架,并配套发布了多种基于不同修复模型(如FLUX、PowerPaint、SDXL)的干扰数据集。这些工作系统探索了生成式修复技术在构造可控负样本中的作用,进一步推动了身份嵌入模型(如nearid-siglip2)的优化与评估,为视觉表示学习领域贡献了新的方法论与基准资源。
数据集最近研究
最新研究方向
在视觉表征学习领域,NearID-Qwen数据集正推动身份嵌入模型的前沿探索。该数据集通过Qwen基修复技术生成近身份干扰项,为模型区分真实身份与背景捷径提供了精准的测试基准。当前研究聚焦于利用此类合成数据提升模型对物体本质特征的辨识能力,减少对上下文信息的依赖,相关进展已与多模态大模型及可控图像生成技术深度融合,为细粒度识别和鲁棒性学习开辟了新路径。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作