gustproof/danbooru-artists-10k
收藏Hugging Face2024-04-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/gustproof/danbooru-artists-10k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含从Danbooru收集的10,000位艺术家的图像。图像主要来源于一个镜像站点,但有六张图像缺失或损坏,这些图像直接从Danbooru获取。每位艺术家由30张图像代表。该数据集旨在用于与艺术风格相关的度量学习或细粒度分类任务。艺术家及其图像按80%、10%和10%的比例分为训练集、验证集和测试集。
该数据集包含从Danbooru收集的10,000位艺术家的图像。图像主要来源于一个镜像站点,但有六张图像缺失或损坏,这些图像直接从Danbooru获取。每位艺术家由30张图像代表。该数据集旨在用于与艺术风格相关的度量学习或细粒度分类任务。艺术家及其图像按80%、10%和10%的比例分为训练集、验证集和测试集。
提供机构:
gustproof
原始信息汇总
Danbooru Artists 10k 数据集概述
数据集简介
- 来源: 该数据集包含从Danbooru收集的10,000名艺术家的图像。
- 图像数量: 每位艺术家有30张图像,总计300,000张图像。
- 用途: 主要用于度量学习和艺术风格的细粒度分类任务。
- 数据分割: 艺术家及其图像按照80%、10%、10%的比例分为训练集、验证集和测试集。
数据集规模
- 规模类别: 100K<n<1M
数据格式
- 图像格式: WebP文件,打包在
a10k.zip中。 - 分割信息: 分割信息存储在
split.txt中,每行格式为artist_split image_split artist_name file_path。
许可证
- 许可证: cc-by-nc-sa-4.0
搜集汇总
数据集介绍

构建方式
Danbooru Artists 10k数据集的构建,是以Danbooru平台上的10,000位艺术家的图像为来源,每位艺术家选取30幅作品,总计300,000幅图像。这些图像经过筛选,确保质量,并按照80%、10%、10%的比例分割为训练集、验证集和测试集,旨在服务于度量化学习或细粒度分类任务,如艺术风格的识别与分类。
使用方法
使用Danbooru Artists 10k数据集,研究者首先需要从提供的镜像站点下载图像压缩包,解压后通过`split.txt`文件获取数据集的划分信息。该文件详细记录了每个艺术家的图像在训练、验证和测试集中的分布,以及对应的文件路径,便于研究者根据需要加载数据集的不同部分。
背景与挑战
背景概述
Danbooru Artists 10k数据集,创建于近期,由Danbooru平台提供,旨在推动艺术风格相关的度量和细粒度分类任务的研究。该数据集汇聚了10,000位艺术家的作品,每位艺术家均有30幅图像,总计300,000幅图像。数据集的构建,不仅丰富了艺术领域的图像资源,也为艺术风格识别、艺术家作品分类等研究领域提供了重要的数据支撑。其规范的数据划分(训练集、验证集、测试集各占80%、10%、10%)使得该数据集在学术界和应用领域具有广泛的影响力。
当前挑战
在构建Danbooru Artists 10k数据集的过程中,研究团队面临了多个挑战。首先,图像的收集和整理工作繁琐且易出错,特别是从镜像站点到原始站点的数据完整性校验。其次,数据集的标注和分类任务对艺术风格的理解要求高,需确保标注的一致性和准确性。此外,如何有效利用这些图像进行细粒度分类和度量学习,也是当前研究的一大挑战。数据集在应对这些挑战的同时,也为相关领域的研究提供了新的视角和工具。
常用场景
经典使用场景
在艺术风格识别与细粒度分类领域,Danbooru Artists 10k数据集被广泛运用。该数据集汇聚了来自10,000位艺术家的图像作品,为研究人员提供了一个丰富的资源库,以开展诸如风格迁移、艺术家作品归档等任务。借助其精细的划分,该数据集在零样本图像分类与图像分类任务中展现出独特的应用价值。
解决学术问题
Danbooru Artists 10k数据集的构建,解决了艺术风格分类中样本稀疏性与类别不平衡的难题。它通过提供均衡的艺术家代表作品,使得学术研究者能够更准确地评估和提升算法在细粒度分类任务中的性能,推动了相关领域的学术研究进展。
实际应用
在商业与创意产业中,Danbooru Artists 10k数据集的实际应用场景包括但不限于艺术品风格分析、个性化推荐系统以及图像内容审核。其丰富的图像资源使得相关技术在文化娱乐、在线教育等多个领域得到广泛应用。
数据集最近研究
最新研究方向
在计算机视觉与艺术风格识别领域,Danbooru Artists 10k数据集以其独特的艺术作品分类与metric learning任务,吸引了众多研究者的关注。近期研究方向主要聚焦于细粒度图像分类,探索如何更精确地区分不同艺术家的风格特点,进而提升艺术作品的风格识别准确度。此数据集的运用,在推动艺术风格识别技术发展的同时,也为艺术作品的数字化管理与分类提供了强有力的数据支撑,对文化保存与传播具有重要意义。
以上内容由遇见数据集搜集并总结生成



