ImageNet-Sketch-HQ

Hugging Face2025-05-05 更新2025-05-06 收录

下载链接：

https://huggingface.co/datasets/tumuyan2/ImageNet-Sketch-HQ

下载链接

链接失效反馈

官方服务：

资源简介：

ImageNet-Sketch数据集是一个精选的图像数据集，由原50000张图像的ImageNet-Sketch数据集中精选而出，包含数量小于25000张的图像。数据集保留了原有的文件结构和文件名，主要用于艺术类别，通过谷歌图片的'黑白'配色方案查询构建。数据集经过了手动清理和增强处理，移除了分辨率低于360x360的图像以及经过翻转和旋转的图像。目前数据集还在进一步优化中，将去除含水印的图像和低质量图像，并对图像边缘进行裁剪。

The ImageNet-Sketch dataset is a curated subset selected from the original ImageNet-Sketch dataset which originally contained 50,000 images, with the current size being fewer than 25,000 images. It retains the original file structure and filenames, and was built using Google Images searches with the 'black and white' color scheme filter, primarily targeting artistic category tasks. The dataset has been manually cleaned and enhanced, with images having a resolution lower than 360×360, as well as flipped and rotated images, removed. Currently, the dataset is undergoing further optimization, which will involve removing watermarked and low-quality images, as well as cropping image edges.

创建时间：

2025-05-04

原始信息汇总

数据集概述

基本信息

名称: ImageNet-Sketch-HQ
许可证: MIT
标签: art
规模: 10K<n<100K

数据来源

原始数据集: ImageNet-Sketch
下载来源: OpenDataLab/ImageNet-Sketch

数据集构建

构建方法: 使用Google Image查询"sketch of __"（__为标准类名），仅在"黑白"配色方案内搜索。
初始查询: 每个类查询100张图像。
清理过程: 手动删除不相关或相似但不同类的图像。
数据扩充: 对于少于50张图像的类，通过翻转和旋转图像进行扩充。

数据集精选

精选内容: 保留原始文件结构和文件名，去除以下图像：
1. 分辨率低于360x360的图像。
2. 翻转和旋转的图像。
待进一步筛选:
1. 含水印的图片。
2. 低质量图像（如明显使用nearest放大，非常潦草的简笔画）。
待进一步优化:
1. 裁切文件边缘。

相关资源

标注工具: Argilla
压缩分辨率数据: ImageNet-Sketch-HQ-Resized
临时存储: image_net-sketch-hq-resized

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，高质量的数据集对于模型训练至关重要。ImageNet-Sketch-HQ数据集源于对原始ImageNet-Sketch的精心筛选，构建过程采用系统化方法。研究人员通过Google图片搜索获取初始数据，以"sketch of __"为查询关键词，限定黑白配色方案，每个类别采集100张候选图像。经过严格的人工清洗，剔除无关或类别不符的图像后，对数量不足的类别进行翻转和旋转等数据增强处理。最终版本进一步优化，移除分辨率低于360x360及经过几何变换的图像，确保数据质量。

使用方法

该数据集适用于素描识别、跨域迁移学习等前沿研究方向。使用时应首先通过HuggingFace平台获取经压缩处理的高质量版本，注意其与原始数据集的继承关系。研究人员可利用保留的文件结构快速定位特定类别图像，建议结合配套的标注平台进行扩展研究。对于模型训练，推荐先排除待优化的水印和低质量图像子集，重点关注已通过严格筛选的高品质样本，以获得更可靠的实验结果。数据集支持直接加载至主流深度学习框架，实现端到端的计算机视觉任务流程。

背景与挑战

背景概述

ImageNet-Sketch-HQ数据集源于对原始ImageNet-Sketch数据集的深度优化，由研究人员通过Google Image查询'sketch of __'构建，专注于黑白素描风格的图像收集。该数据集旨在为计算机视觉领域提供高质量的素描图像资源，特别适用于图像分类和风格迁移等任务的研究。通过手动清理和图像增强技术，数据集在保持1000个ImageNet类别的基础上，提升了图像的质量和一致性。这一工作不仅丰富了素描图像的数据资源，也为模型在非真实感图像上的泛化能力研究提供了重要支持。

当前挑战

ImageNet-Sketch-HQ数据集在构建过程中面临多重挑战。在领域问题方面，如何确保素描图像与原始ImageNet类别的语义一致性是一大难点，尤其是在处理抽象或风格化较强的素描时。构建过程中的挑战包括图像质量的筛选，例如去除低分辨率、水印及低质量图像，这些工作需要大量人工干预。此外，数据增强技术的应用也需谨慎，以避免引入不必要的偏差。这些挑战的解决直接关系到数据集在计算机视觉任务中的实用性和可靠性。

常用场景

经典使用场景

在计算机视觉领域，ImageNet-Sketch-HQ数据集为研究者提供了一个高质量的素描图像集合，专门用于模型在素描图像上的分类和识别能力测试。通过精选高分辨率、无翻转旋转的图像，该数据集确保了训练和评估过程的严谨性，尤其在研究模型对素描风格的理解和泛化能力时表现出色。

解决学术问题

该数据集有效解决了素描图像分类中的关键学术问题，如模型在非真实图像上的泛化能力、风格迁移的鲁棒性以及低质量数据对模型性能的影响。通过提供高质量的素描样本，研究者能够更准确地评估和改进模型在艺术风格数据上的表现，推动了计算机视觉与艺术交叉领域的研究进展。

实际应用

在实际应用中，ImageNet-Sketch-HQ数据集被广泛用于开发艺术风格识别系统、教育辅助工具以及创意设计软件。例如，在数字艺术平台中，基于该数据集训练的模型能够自动识别用户上传的素描内容，为其推荐相关艺术资源或提供风格转换建议。

数据集最近研究