five

Photozilla

收藏
arXiv2021-06-22 更新2024-06-21 收录
下载链接:
https://trisha025.github.io/Photozilla/
下载链接
链接失效反馈
官方服务:
资源简介:
Photozilla是一个大规模的摄影数据集,由新加坡科技设计大学创建,包含超过990k张属于10种不同摄影风格的图像。该数据集通过Flickr API收集,每种风格约有100k张图像。数据集的创建旨在支持图像分类和识别技术的发展,特别是在自动识别和分类不同摄影风格方面。Photozilla的应用领域广泛,包括图像搜索优化、推荐系统、版权自由的合成图像生成等,旨在解决数字摄影领域中风格识别和图像管理的问题。

Photozilla is a large-scale photography dataset developed by the Singapore University of Technology and Design (SUTD), housing over 990,000 images across 10 distinct photographic styles. Collected through the Flickr API, this dataset contains approximately 100,000 images for each style. Its creation aims to support the advancement of image classification and recognition technologies, specifically for the automatic identification and categorization of diverse photographic styles. Photozilla covers a broad range of application domains, including image search optimization, recommendation systems, copyright-free synthetic image generation, and more, and is designed to address challenges in style recognition and image management within the field of digital photography.
提供机构:
新加坡科技设计大学
创建时间:
2021-06-22
搜集汇总
数据集介绍
main_image_url
构建方式
Photozilla数据集的构建主要依赖于Flickr API,通过爬取Flickr平台上具有特定标签的图片来收集不同摄影风格的图像。数据集共包含超过990k张图片,涵盖了10种不同的摄影风格。为了验证数据集的有效性,研究者使用了3种先进的分类模型进行训练,并对10种风格进行自动分类,实现了超过96%的准确率。此外,为了适应摄影风格的快速变化,研究者还提出了基于Siamese网络的少样本学习模型,能够在仅有25个训练样本的情况下,对新出现的摄影风格进行准确识别,实现了约68%的准确率。
特点
Photozilla数据集的主要特点在于其规模庞大,包含了超过990k张图片,涵盖了10种不同的摄影风格,能够满足各种计算机视觉应用的需求。此外,数据集还包含了10种额外风格的图片,尽管样本数量较少(每个类别仅有25张),但通过使用预训练的10类别分类模型和Siamese网络架构,模型仍能对这些新风格进行准确分类。最后,数据集的构建和应用过程充分考虑了摄影行业的快速变化,以及少样本学习模型在应对新风格时的优势。
使用方法
Photozilla数据集的使用方法主要包括两个方面:一是使用数据集进行摄影风格的分类任务,通过训练先进的分类模型,实现对图片所属摄影风格的自动识别;二是利用少样本学习模型,对新出现的摄影风格进行快速适应和识别。具体来说,可以使用数据集中的大量样本进行分类模型的训练和验证,然后使用少量样本对少样本学习模型进行训练和测试。此外,还可以利用数据集中的图像特征嵌入,进行图像检索、推荐系统等应用。
背景与挑战
背景概述
随着社交媒体平台的兴起,数字摄影得到了飞速发展,推动了视觉应用领域的繁荣。在这样的背景下,新加坡科技设计大学的研究团队提出了一个名为'Photozilla'的大规模摄影数据集,该数据集包含超过990,000张图片,涵盖了10种不同的摄影风格。该数据集的创建旨在为图像分类、风格检索等视觉应用提供数据支持,并训练了3个分类模型,以实现对这些摄影风格的自动分类。此外,研究团队还提出了一个基于Siamese网络的少样本学习模型,仅使用25个训练样本即可对新风格进行分类,实现了超过68%的准确率。
当前挑战
尽管Photozilla数据集为摄影风格分类提供了大量数据,但摄影领域不断涌现的新风格对模型的适应性提出了挑战。传统的深度学习分类模型需要大量数据进行训练,而少样本学习技术需要在更少的数据上实现较高的准确率。此外,构建大规模数据集的过程也面临数据收集、标注等挑战。
常用场景
经典使用场景
Photozilla数据集,包含超过990,000张图片,涵盖了10种不同的摄影风格,如风景摄影、旅行摄影、人像摄影等。该数据集的经典使用场景之一是用于摄影风格分类,通过训练3种分类模型,可以自动将图片归类到相应的风格中,从而实现基于风格的图像检索、图像推荐、版权免费合成图像的生成等多种应用。
衍生相关工作
Photozilla数据集的发布,为摄影风格识别和分类的研究提供了宝贵的数据资源,推动了相关领域的研究进展。基于Photozilla数据集,研究人员可以进一步探索摄影风格的变化趋势、不同风格之间的关联性等问题。此外,Photozilla数据集还可以与其他数据集结合,进行多模态分析和序列预测任务,如下一个兴趣点(Point-Of-Interest)推荐等。
数据集最近研究
最新研究方向
随着数字摄影技术的飞速发展,摄影风格层出不穷,对图像分类和识别提出了更高的要求。Photozilla数据集的提出为摄影风格识别提供了丰富的数据基础,并基于此训练了三种分类模型,实现了对10种摄影风格的准确识别。此外,针对摄影风格快速演变的特点,研究提出了基于Siamese网络的少样本学习方法,仅用25个训练样本即可对新风格进行有效识别,为摄影风格识别的研究提供了新的思路。
相关研究论文
  • 1
    Photozilla: A Large-Scale Photography Dataset and Visual Embedding for 20 Photography Styles新加坡科技设计大学 · 2021年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作