five

ICTA2Net Dataset

收藏
github2025-11-18 更新2025-11-19 收录
下载链接:
https://github.com/chasecjg/ICTA2Net
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由多组具有不同白平衡偏移的图像及其对应的高质量美学参考图像组成。它基于MIT-Adobe FiveK和PPR10K数据集中的线性原始RGB图像构建,通过精确模拟相机ISP过程,生成每个图像在不同色温下的多个渲染版本。图中展示了数据集中不同色温图像的t-SNE可视化。

This dataset comprises multiple sets of images with varying white balance shifts, paired with their corresponding high-quality aesthetic reference images. Built upon the linear raw RGB images from the MIT-Adobe FiveK and PPR10K datasets, it generates multiple rendered versions of each image under different color temperatures via precise simulation of the camera ISP (Image Signal Processor) process. The figure presents the t-SNE visualization of images with different color temperatures within this dataset.
创建时间:
2025-11-08
原始信息汇总

数据集概述

数据集名称

ICTA2Net

核心研究内容

图像色温美学评估

数据集构成

  • 基于MIT-Adobe FiveK和PPR10K数据集的线性原始RGB图像构建
  • 包含多组具有不同白平衡偏移的图像
  • 每张图像对应高质量美学参考图像
  • 通过精确模拟相机ISP过程,生成具有不同色温的多个渲染版本

数据特征

  • 包含不同色温下图像的t-SNE可视化
  • 提供图像色温变化的系统分析

模型框架

ICTA2Net模型包含四个核心组件:

  • 色温编码器:捕捉色温变化
  • 上下文感知模块:包括视觉编码器、文本编码器和文本去噪模型
  • 跨模态融合模块:实现视觉-文本融合
  • 成对排序预测器:进行美学偏好估计

可视化结果

  • 提供模型排序结果的可视化展示
  • 美学评分从左到右、从上到下逐渐降低

相关资源

  • 论文地址:https://github.com/chasecjg/ICTA2Net/blob/main/paper/Thinking%20Aesthetics%20Assessment%20of%20Image%20Color%20Temperature%20Models%2C%20Datasets%20and%20Benchmarks.pdf
  • 项目主页:https://chasecjg.github.io/ICTA2Net.github.io/
  • 代码发布:预计11月底发布

引用信息

bibtex @inproceedings{cheng2026thinking, title = {Thinking Aesthetics Assessment of Image Color Temperature: Models, Datasets and Benchmarks}, author = {Cheng, Jinguang and Li, Chunxiao and He, Shuai and Chen, Taiyu and Ming, Anlong}, booktitle = {Proceedings of the 40th AAAI Conference on Artificial Intelligence (AAAI)}, year = {2026}, note = {Poster}, url = {https://github.com/chasecjg/ICTA2Net/tree/main} }

搜集汇总
数据集介绍
main_image_url
构建方式
在图像美学评估领域,ICTA2Net数据集基于MIT-Adobe FiveK和PPR10K数据集中的线性原始RGB图像构建。通过精确模拟相机图像信号处理流程,系统化生成了具有不同色温偏移的多版本渲染图像,每个原始图像均配有高质量美学参考样本,形成完整的对比评估框架。
特点
该数据集的核心特征体现在其多模态架构与精细化标注体系。通过t-SNE可视化可观察到色温特征在向量空间的连续分布,同时结合视觉编码与文本描述构建跨模态关联,为色温美学评估提供多维度的数据支撑。图像样本涵盖从冷到暖的完整色温谱系,确保模型能捕捉人类对色彩美学的感知差异。
使用方法
使用者可通过加载经过标准化的图像序列与对应标注文件,输入至ICTA2Net模型的四模块架构进行处理。首先由色温编码器提取色彩特征,再通过上下文感知模块融合视觉与文本信息,最终经由跨模态融合与成对排序预测器输出美学评分。该流程支持端到端的色温美学偏好评估与可视化结果验证。
背景与挑战
背景概述
在计算机视觉与图像美学评估领域,色温作为影响视觉感知的重要属性,长期以来缺乏系统的量化研究框架。ICTA2Net数据集由程金广等研究人员于2026年构建,依托MIT-Adobe FiveK和PPR10K数据集中的线性原始RGB图像,通过精确模拟相机ISP处理流程,生成具有不同色温变化的渲染图像集合。该数据集的核心研究目标在于建立图像色温与美学质量之间的关联模型,推动计算美学在色彩感知维度的发展,其创新性工作已入选第40届AAAI人工智能会议,为图像质量评估领域提供了重要的基准数据支撑。
当前挑战
图像色温美学评估面临的核心挑战在于色温感知的主观性与文化差异性,不同观察者对同一色温图像可能产生截然不同的美学判断。在数据集构建过程中,技术挑战主要体现在原始RAW数据的精确色温模拟与转换,需要保持图像细节真实性的同时实现色温的连续可控变化。此外,跨模态融合中视觉特征与文本描述的语义对齐,以及成对排序预测中的偏好一致性维护,都是模型训练需要克服的关键难题。这些挑战共同构成了色温美学评估这一交叉研究领域的核心瓶颈。
常用场景
经典使用场景
在图像美学评估领域,ICTA2Net数据集通过提供多组具有不同白平衡偏移的图像及其高质量美学参考图像,成为评估图像色温美学质量的基准工具。该数据集源自MIT-Adobe FiveK和PPR10K的线性原始RGB图像,通过精确模拟相机ISP过程生成不同色温的渲染版本,使研究人员能够系统分析色温变化对视觉美感的影响。其t-SNE可视化技术清晰展示了色温分布的多样性,为模型训练提供了丰富的色彩空间表征基础。
衍生相关工作
该数据集已催生多项经典衍生研究,其中ICTA2Net框架作为代表性工作,开创了色温感知与文本语义融合的美学评估新路径。其构建的上下文感知模块启发了后续跨模态美学分析系统的开发,而成对排序机制则为图像质量评估领域提供了新的方法论参考。这些成果持续推动着计算机视觉与人类感知研究的交叉融合。
数据集最近研究
最新研究方向
在图像美学评估领域,ICTA2Net数据集聚焦于色温对视觉感知的深层影响机制研究。当前前沿探索主要围绕多模态融合技术展开,通过结合视觉特征与语义上下文,构建端到端的色温美学评估模型。该方向与数字内容创作行业的智能化需求相呼应,特别是在智能手机影像系统和专业修图工具中,自动色温调节正成为提升用户体验的关键技术。这类研究不仅推动了计算美学与色彩科学的交叉融合,更为建立可解释性人工智能系统提供了新的范式,其技术成果已逐步应用于影视后期制作和社交平台图像优化等实际场景。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作