logasja/mit-adobe-fivek
收藏Hugging Face2024-03-15 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/logasja/mit-adobe-fivek
下载链接
链接失效反馈官方服务:
资源简介:
Adobe FiveK数据集包含5000张由不同摄影师使用SLR相机拍摄的照片,这些照片以RAW格式保存,涵盖了广泛的场景、主题和光照条件。五位摄影学校的学生使用Adobe Lightroom软件对这些照片进行了色调调整,目的是达到视觉上令人愉悦的效果。数据集分为训练集、测试集和验证集,每个集合包含不同数量的样本和字节大小。数据集的许可信息包括Adobe和AdobeMIT两种许可,每种许可适用于不同的文件。
Adobe FiveK Dataset consists of 5,000 photographs captured by various photographers using SLR cameras, stored in RAW format, and covering a broad range of scenes, subjects and lighting conditions. Five photography students from a photography school applied tonal adjustments to these photographs using Adobe Lightroom software, aiming to achieve visually pleasing results. The dataset is partitioned into training, test and validation subsets, each of which has a distinct number of samples and total byte size. The licensing information for the dataset includes two types of licenses: Adobe License and AdobeMIT License, with each license applicable to different files.
提供机构:
logasja
原始信息汇总
数据集概述
数据集名称
- MIT Adobe FiveK
数据集配置
- config_name: a, b, c, d, e
- features:
- original: dtype - image
- augmented: dtype - image
- location: dtype - class_label (outdoor, indoor, unknown)
- time: dtype - class_label (day, unknown, dusk, night)
- light: dtype - class_label (sun_sky, artificial, unknown, mixed)
- subject: dtype - class_label (people, man_made, nature, unknown, animals, abstract)
- license: dtype - class_label (Adobe, AdobeMIT)
数据集分割
- train: 3500 examples, num_bytes - varies by config (e.g., 83516576303 for config_name a)
- test: 1000 examples, num_bytes - varies by config (e.g., 24332706376 for config_name a)
- validation: 500 examples, num_bytes - varies by config (e.g., 11930052394 for config_name a)
数据集大小
- download_size: varies by config (e.g., 119291008509 for config_name a)
- dataset_size: varies by config (e.g., 119779335073 for config_name a)
数据集文件路径
- train: path - {config}/train-*
- test: path - {config}/test-*
- validation: path - {config}/validation-*
数据集任务类别
- image-to-image
- feature-extraction
数据集许可证
- license_name: adobe-mit
- license_details: A custom license developed for this dataset by Adobe and MIT.
数据集标签
- tags: adobe, aesthetic
- pretty_name: MIT Adobe FiveK
- size_categories: 1K<n<10K
- paperswithcode_id: mit-adobe-fivek
数据集来源
- Repository: https://data.csail.mit.edu/graphics/fivek/
- Paper: http://people.csail.mit.edu/vladb/photoadjust/
数据集使用
- Direct Use: [More Information Needed]
- Out-of-Scope Use: [More Information Needed]
数据集创建
-
Acknowledgements:
- Grateful to Katrin Eismann and Jeff Schewe for providing invaluable advice and for introducing us to the community of professional photographers.
- Thank Todd Carroll, David Mager, Jaime Permuth, LaNola Katheleen Stone, and Damian Wampler for their incredible patience while retouching thousands of photos.
- Special thanks to everyone who contributed their photos to this dataset: without you this work would not have been possible.
-
Funded by: Foxconn and NSF (0964004) and a gift from Adobe
-
License:
- License LicenseAdobe.txt covers files listed in filesAdobe.txt.
- License LicenseAdobeMIT.txt covers files listed in filesAdobeMIT.txt.
数据集结构
- [More Information Needed]
数据集创建过程
- [More Information Needed]
数据集注释
- [More Information Needed]
数据集偏差、风险和限制
- [More Information Needed]
数据集引用
-
BibTeX:
@inproceedings{fivek, author = "Vladimir Bychkovsky and Sylvain Paris and Eric Chan and Fr{e}do Durand", title = "Learning Photographic Global Tonal Adjustment with a Database of Input / Output Image Pairs", booktitle = "The Twenty-Fourth IEEE Conference on Computer Vision and Pattern Recognition", year = "2011" }
数据集卡片作者和联系人
- Dataset Card Authors: @logasja
- Dataset Card Contact: @logasja
搜集汇总
数据集介绍

构建方式
该数据集由5000张由不同摄影师使用单反相机拍摄的RAW格式照片组成,涵盖了广泛的场景、主题和光照条件。这些照片由五名摄影学生使用Adobe Lightroom软件进行色调调整,旨在实现视觉上令人愉悦的效果,类似于明信片。数据集的构建过程包括对每张照片进行详细的分类标注,如位置、时间、光照和主题等,以确保数据的多样性和丰富性。
特点
数据集的显著特点在于其高质量的图像和详细的元数据标注,这些标注包括照片的拍摄位置、时间、光照条件和主题等。此外,数据集提供了原始图像和经过调整的图像,便于进行图像处理和计算机视觉任务的研究。数据集的多样性和专业性使其成为学习摄影调整和图像处理的理想资源。
使用方法
该数据集适用于图像到图像的转换和特征提取任务。用户可以通过HuggingFace平台访问数据集,并根据需要选择不同的配置(如a、b、c、d、e)进行训练、测试和验证。数据集的结构设计合理,便于研究人员和开发者进行实验和模型训练。使用时需注意遵守数据集的许可协议,确保合法使用。
背景与挑战
背景概述
在图像处理与计算机视觉领域,Adobe FiveK数据集由麻省理工学院(MIT)与Adobe公司合作创建,旨在为学习摄影调整提供丰富的数据资源。该数据集于2011年由Vladimir Bychkovsky、Sylvain Paris、Eric Chan和Frédo Durand等研究人员发布,包含了5000张由不同摄影师使用单反相机拍摄的RAW格式照片。这些照片涵盖了广泛的场景、主题和光照条件,并由五名摄影学生使用Adobe Lightroom软件进行色调调整,以达到视觉上令人愉悦的效果。该数据集的创建不仅推动了摄影调整算法的研究,还为图像增强和美学评估提供了宝贵的基准。
当前挑战
Adobe FiveK数据集在构建过程中面临多项挑战。首先,收集和处理5000张高质量的RAW格式照片需要大量的时间和资源。其次,确保照片涵盖多样化的场景和光照条件,以提高数据集的泛化能力,是一项复杂的工作。此外,雇佣专业摄影学生进行色调调整,并确保其一致性和高质量,增加了数据集的构建成本和难度。在数据集的使用方面,由于原始数据格式为RAW,转换为其他格式(如WebP)时可能引入压缩损失,影响数据质量。最后,数据集的巨大规模(超过1TB)对存储和处理能力提出了高要求,限制了其在某些环境下的应用。
常用场景
经典使用场景
在图像处理领域,MIT Adobe FiveK数据集的经典使用场景主要集中在图像增强和色调调整的研究中。该数据集包含了5000张由不同摄影师拍摄的RAW格式照片,每张照片都由五位摄影学生使用Adobe Lightroom进行色调调整。这种双重的数据结构使得研究人员能够深入探讨图像增强算法的效果,特别是在模拟专业摄影师的色调调整技巧方面。
解决学术问题
MIT Adobe FiveK数据集解决了图像处理领域中关于自动色调调整和图像增强的常见学术研究问题。通过提供大量经过专业调整的图像对,该数据集为研究人员提供了一个标准化的测试平台,用以评估和改进现有的图像处理算法。这不仅推动了图像增强技术的发展,还为自动图像编辑工具的开发提供了宝贵的数据支持。
衍生相关工作
基于MIT Adobe FiveK数据集,许多相关的经典工作得以展开。例如,研究人员开发了多种基于深度学习的图像增强模型,这些模型能够自动学习并应用专业摄影师的色调调整技巧。此外,该数据集还启发了关于图像美学评估的研究,推动了图像质量评价标准的制定。这些衍生工作不仅丰富了图像处理领域的研究内容,还促进了相关技术的实际应用。
以上内容由遇见数据集搜集并总结生成



