five

NearID-PowerPaint

收藏
Hugging Face2026-04-03 更新2026-04-04 收录
下载链接:
https://huggingface.co/datasets/Aleksandar/NearID-PowerPaint
下载链接
链接失效反馈
官方服务:
资源简介:
NearID-PowerPaint 数据集包含通过 PowerPaint 修复生成的近身份干扰图像,分辨率为 512×512,是 NearID 项目的一部分。该数据集用于训练和评估能够区分真实身份与上下文捷径的身份嵌入模型。每个样本包含最多 3 个干扰图像(nimg1, nimg2, nimg3),这些图像是通过将语义相似但不同的对象实例修复到与基础 NearID 数据集中相应锚点相同的背景中生成的。数据集结构包括样本 ID、对象类别、类别描述、干扰图像、图像数量、Objaverse 对象标识符、生成提示和质量标签等字段。该数据集适用于图像特征提取、身份表示学习和度量学习等任务。
创建时间:
2026-04-02
原始信息汇总

NearID-PowerPaint 数据集概述

数据集基本信息

  • 数据集名称: NearID-PowerPaint (Near-Identity Distractors)
  • 托管地址: https://huggingface.co/datasets/Aleksandar/NearID-PowerPaint
  • 语言: 英语
  • 许可证: CC-BY-4.0
  • 数据规模: 10K<n<100K
  • 任务类别: 图像特征提取
  • 标签: nearid, near-identity-distractors, identity-embedding, inpainting, synthetic, metric-learning

数据集描述

该数据集包含通过PowerPaint 图像修复512×512分辨率下生成的近身份干扰项,是NearID项目的一部分。每个样本包含最多3个干扰图像,这些图像被修复到与基础数据集Aleksandar/NearID中对应锚点完全相同的背景/上下文中。这些干扰项用于训练和评估能够区分真实身份与上下文捷径的身份嵌入模型。

数据集结构

列名 类型 描述
id int64 样本ID(与基础NearID数据集匹配)
category string 对象类别(rigid
category_description string 对象的自然语言描述
nimg1, nimg2, nimg3 image 近身份干扰图像(每个样本最多3个)
n_images int64 有效干扰图像的数量
objaverse_id string 源Objaverse对象标识符
prompts1, prompts2, prompts3 string 每个干扰项的生成提示词
quality string 质量标签

数据分割: train

干扰项生成方法

  1. 为基础NearID数据集中的每个锚点身份检索一个语义相似但不同的对象实例。
  2. 使用PowerPaint 图像修复将干扰项实例修复到与锚点相同的背景中。
  3. 分辨率:512×512像素。

快速开始

python from datasets import load_dataset

加载此负样本源

ds = load_dataset("Aleksandar/NearID-PowerPaint")

加载基础正样本用于锚点/正样本对

positives = load_dataset("Aleksandar/NearID")

NearID 系列数据集

数据集 描述 分辨率
Aleksandar/NearID 多视角正样本(锚点 + 正样本视角) 基础
Aleksandar/NearID-Flux 通过FLUX.1修复生成的近身份干扰项 512×512
Aleksandar/NearID-Flux_1024 通过FLUX.1修复生成的近身份干扰项 1024×1024
Aleksandar/NearID-FluxC 通过FLUX.1 Canny引导修复生成的近身份干扰项 512×512
Aleksandar/NearID-FluxC_1024 通过FLUX.1 Canny引导修复生成的近身份干扰项 1024×1024
Aleksandar/NearID-PowerPaint 通过PowerPaint修复生成的近身份干扰项 512×512
Aleksandar/NearID-Qwen 通过基于Qwen的修复生成的近身份干扰项 512×512
Aleksandar/NearID-Qwen_1328 通过基于Qwen的修复生成的近身份干扰项 1328×1328
Aleksandar/NearID-SDXL 通过Stable Diffusion XL修复生成的近身份干扰项 512×512
Aleksandar/NearID-SDXL_1024 通过Stable Diffusion XL修复生成的近身份干扰项 1024×1024

相关资源

许可证与引用

  • 许可证: 本数据集基于CC-BY-4.0许可证发布。它源自SynCD数据集(MIT许可证,版权所有 2022 SynCD)。
  • 引用: bibtex @article{cvejic2026nearid, title={NearID: Identity Representation Learning via Near-identity Distractors}, author={Cvejic, Aleksandar and Abdal, Rameen and Eldesokey, Abdelrahman and Ghanem, Bernard and Wonka, Peter}, journal={arXiv preprint arXiv:2604.01973}, year={2026} }
搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉领域,身份表征学习旨在捕捉对象的本质特征,而NearID-PowerPaint数据集为此提供了精心构建的负样本。该数据集的构建始于基础数据集NearID中的每个锚点身份,通过检索语义相似但不同的对象实例作为干扰项。随后,利用先进的PowerPaint图像修复技术,将这些干扰项实例无缝地嵌入到与锚点图像完全相同的背景与上下文中,生成分辨率为512×512像素的图像。这一过程确保了背景的一致性,从而迫使模型必须依赖对象的内在身份特征而非环境线索进行区分,为身份嵌入模型的训练与评估提供了高度受控的对比样本。
特点
该数据集的核心特征在于其提供的“近身份干扰项”,这些图像在视觉上与锚点对象高度相似,却属于不同实例,且共享完全一致的背景。数据集结构清晰,每条样本包含至多三个干扰图像、对应的生成提示词、对象类别描述及质量标签,并与基础数据集通过ID精确对应。作为NearID项目系列的一部分,它专门采用PowerPaint修复方法生成,专注于刚性物体类别,为研究身份表征的鲁棒性提供了标准化、高质量的负样本源,有效挑战模型从复杂背景中剥离并识别对象本质身份的能力。
使用方法
在身份表征学习的研究与应用中,该数据集主要用于模型训练与性能评估。研究者可首先通过`datasets`库加载本数据集作为负样本源,同时加载基础数据集`Aleksandar/NearID`以获取正样本对。通过组合正负样本,可以构建用于度量学习或对比学习的训练三元组或配对数据。在评估阶段,模型需区分锚点图像与这些背景相同的近身份干扰项,从而检验其身份嵌入向量对对象本质特征的捕捉能力,而非对背景信息的依赖。这种使用方法直接支撑了身份表征学习中对判别力与鲁棒性的严谨测评。
背景与挑战
背景概述
NearID-PowerPaint数据集是NearID项目的重要组成部分,专注于身份表征学习领域。该数据集由阿卜杜拉国王科技大学(KAUST)和Snap Research的研究团队于2026年创建,核心研究问题在于如何通过构建近乎相同的干扰项来训练模型,使其能够准确区分对象的本质身份特征,而非依赖背景或上下文等表面线索。这一工作推动了计算机视觉中身份嵌入技术的发展,为细粒度识别和鲁棒性表征学习提供了关键数据支撑。
当前挑战
该数据集旨在解决身份表征学习中的核心挑战,即模型容易受到背景、光照或视角等非本质特征的误导,而忽略对象的真实身份。构建过程中的主要挑战在于生成高质量的近身份干扰图像:需要确保干扰对象在语义上与锚点对象相似但身份不同,同时通过PowerPaint修复技术将其无缝嵌入完全相同的背景中,以消除上下文线索,这对图像生成的一致性与真实性提出了极高要求。
常用场景
经典使用场景
在计算机视觉与身份表征学习领域,NearID-PowerPaint数据集为模型训练与评估提供了精准的负样本资源。该数据集通过PowerPaint修复技术,将语义相似但身份不同的物体实例嵌入到与锚点图像完全相同的背景中,生成了近身份干扰项。这一设计使得模型在区分锚点与干扰项时,必须依赖物体内在的身份特征,而非背景上下文等捷径线索,从而在身份嵌入学习任务中构建了高度可控的对比学习环境。
解决学术问题
该数据集核心解决了身份表征学习中模型过度依赖上下文先验而非本质特征的问题。通过提供背景一致但身份细微差异的样本对,它迫使模型学习更具判别力的身份嵌入,从而提升模型在开放场景下的泛化能力与鲁棒性。其意义在于为度量学习、少样本识别及域泛化等研究方向提供了标准化的评估基准,推动了视觉身份理解从表观匹配向本质特征提取的范式转变。
衍生相关工作
围绕该数据集衍生的经典工作主要集中在身份嵌入模型的优化与评估框架的拓展。例如,基于NearID系列数据训练的nearid-siglip2模型,已成为身份表征学习的强基线;同时,研究社区利用其构建的基准,推动了针对上下文去偏、对抗性鲁棒性以及跨模态身份对齐等一系列方法的创新。这些工作共同深化了对视觉身份本质的理解,并为后续生成式模型在可控合成数据上的应用提供了重要参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作