TAD66K
收藏github2023-11-28 更新2024-05-31 收录
下载链接:
https://github.com/woshidandan/TANet-image-aesthetics-and-quality-assessment
下载链接
链接失效反馈官方服务:
资源简介:
我们构建了一个名为Theme and Aesthetics Dataset(TAD66K)的大型数据集,专门为图像美学评估(IAA)设计。该数据集包含66,000张图片,覆盖47个流行主题。所有图片均根据主题手工精心挑选,除了常见的美学标准外,还提供了针对47个主题的47个标准。每个主题的图片独立标注,每张图片包含至少1200个有效标注,是目前标注最丰富的数据集之一,这些高质量的标注有助于更深入地了解模型的性能。
We have constructed a large-scale dataset named Theme and Aesthetics Dataset (TAD66K), specifically designed for Image Aesthetic Assessment (IAA). This dataset comprises 66,000 images, covering 47 popular themes. All images are meticulously handpicked according to their themes, and in addition to common aesthetic criteria, it provides 47 criteria tailored to each of the 47 themes. Images for each theme are independently annotated, with each image containing at least 1,200 valid annotations, making it one of the most richly annotated datasets available. These high-quality annotations facilitate a deeper understanding of model performance.
创建时间:
2022-04-22
原始信息汇总
数据集概述
TAD66K 数据集
简介
- 主题与美学数据集(TAD66K):包含66,000张图像,覆盖47个流行主题。所有图像均手工精选,每个主题有其特定的美学标准。每张图像至少包含1200个有效注释,是目前注释最丰富的数据集之一。
下载数据集
TANet 模型
简介
- 主题与美学网络(TANet):一种基线模型,能够维持对美学的恒定感知,有效处理注意力分散问题,并能根据识别的主题自适应学习预测美学的规则。TANet在AVA、FLICKR-AES及TAD66K三个代表性数据集上与17种方法比较,取得了最先进的性能。
环境安装
- 依赖软件包包括pandas, nni, requests, torchvision, numpy, scipy, tqdm, torch, scikit_learn, tensorboardX等。
运行代码
- 使用nni进行超参数调优。运行命令:
nnictl create --config config.yml -p 8999。Web UI地址:http://127.0.0.1:8999或http://172.17.0.3:8999。
引用
-
若认为本工作有价值,请引用论文:
@article{herethinking, title={Rethinking Image Aesthetics Assessment: Models, Datasets and Benchmarks}, author={He, Shuai and Zhang, Yongchang and Xie, Rui and Jiang, Dongxiang and Ming, Anlong}, journal={IJCAI}, year={2022}, }
搜集汇总
数据集介绍

构建方式
TAD66K数据集的构建基于大规模的手工筛选和主题导向的设计理念。该数据集包含66,000张图片,涵盖47个流行主题,每张图片均经过精心挑选以确保主题相关性。此外,数据集为每个主题提供了47个特定的美学标准,每张图片至少包含1200个有效注释,确保了数据的高质量和深度分析的可能性。
特点
TAD66K数据集的显著特点在于其主题导向的设计和丰富的注释。该数据集不仅提供了常见的美学标准,还为每个主题定制了特定的评估标准,使得模型能够更精确地理解和评估不同主题下的图像美学。此外,每张图片的高注释量(至少1200个有效注释)为模型训练提供了丰富的数据支持,有助于提升模型的性能和泛化能力。
使用方法
TAD66K数据集可以通过Google Drive或百度网盘进行下载,下载内容包括图像及其按主题分类的标签。使用该数据集时,建议结合TANet模型进行训练和测试,该模型专门设计用于处理主题导向的美学评估问题。用户可以通过nni工具进行超参数调优,或根据需要对代码进行简单修改以适应不同的训练环境。
背景与挑战
背景概述
TAD66K数据集由北京邮电大学的Shuai He、Yongchang Zhang等研究人员于2022年创建,旨在推动图像美学评估(IAA)领域的研究。该数据集包含66,000张图像,涵盖47个流行主题,每个主题均经过精心挑选和手工标注。TAD66K不仅提供了常见的美学标准,还为每个主题提供了特定的评估标准,每张图像至少包含1200个有效标注,是目前标注最丰富的图像美学评估数据集之一。该数据集的发布为图像美学评估模型的性能提供了更深入的洞察,并在IJCAI 2022会议上引起了广泛关注。
当前挑战
TAD66K数据集在构建过程中面临多重挑战。首先,主题多样性和高标注密度要求研究人员在数据筛选和标注过程中投入大量人力和时间,确保数据的高质量和一致性。其次,不同主题之间的美学标准差异较大,如何设计统一的评估框架以适应多样化的主题是一个技术难题。此外,数据集的规模和复杂性对模型的训练和验证提出了更高的要求,尤其是在处理大规模数据时,如何有效利用计算资源和优化模型性能是当前研究的重点。
常用场景
经典使用场景
TAD66K数据集在图像美学评估领域中具有经典应用场景,主要用于训练和验证基于主题的美学评估模型。该数据集包含66,000张图像,涵盖47个流行主题,每张图像均经过精心挑选并附有丰富的注释,包括至少1200个有效注释。这些注释不仅涵盖常见的美学标准,还针对每个主题提供了专门的评估标准,使得模型能够更精确地理解和预测特定主题下的图像美学。
解决学术问题
TAD66K数据集解决了图像美学评估中的多个学术问题,特别是在处理多主题图像美学评估时,传统方法往往难以兼顾不同主题的独特美学标准。该数据集通过提供针对每个主题的独立注释,帮助研究者开发能够适应不同主题的评估模型,从而提升了模型在多主题环境下的泛化能力和评估精度。这一进展对于推动图像美学评估领域的研究具有重要意义。
衍生相关工作
TAD66K数据集的发布催生了一系列相关研究工作,包括基于该数据集的深度学习模型开发和美学评估方法的创新。例如,研究者提出了Theme and Aesthetics Network (TANet),该模型在多个公开数据集上均取得了最先进的性能。此外,TAD66K还启发了对长尾分布图像美学评估的研究,以及基于CLIP的多因素色彩美学评估等前沿工作,进一步拓展了图像美学评估的应用边界。
以上内容由遇见数据集搜集并总结生成



