five

TST100K

收藏
arXiv2026-04-17 更新2026-04-21 收录
下载链接:
https://dengyuhai.github.io/ICTone_Project/
下载链接
链接失效反馈
官方服务:
资源简介:
TST100K是由OPPO人工智能中心与南开大学联合构建的大规模色调风格迁移数据集,包含10万组经过严格质量控制的内容-参考-风格化图像三元组。该数据集通过预设应用和双重评分机制(美学评分器与色调风格评分器)构建,覆盖人像、风景、夜景等多场景,数据源主要来自PPR10K和MIT-Adobe FiveK等专业摄影数据集。其创新性在于首次为色调迁移任务提供高质量监督数据,解决了该领域长期依赖自监督学习的瓶颈问题,可广泛应用于图像增强、计算摄影等视觉生成任务。

TST100K is a large-scale tonal style transfer dataset jointly constructed by OPPO Artificial Intelligence Center and Nankai University, which contains 100,000 strictly quality-controlled content-reference-stylized image triplets. This dataset is built through preset applications and a dual-scoring mechanism, including an aesthetic scorer and a tonal style scorer. It covers multiple scenarios such as portraits, landscapes and night scenes, with its data sources mainly derived from professional photography datasets like PPR10K and MIT-Adobe FiveK. Its innovation lies in providing high-quality supervised data for the tonal style transfer task for the first time, solving the long-standing bottleneck problem of relying on self-supervised learning in this field. It can be widely applied to visual generation tasks such as image enhancement and computational photography.
提供机构:
南开大学·计算机科学与技术学院; 南开国际先进研究院(深圳福田); OPPO公司·人工智能中心
创建时间:
2026-04-17
原始信息汇总

数据集概述

数据集名称

TST100K 与 TST2K

核心描述

  • TST100K:一个包含100,000个内容-参考-风格化三元组的大规模数据集。
  • TST2K:一个从大规模构建流程中精心策划的、包含2,000个样本的基准数据集,用于可靠评估。

数据集构建目的

解决照片润饰中色调风格迁移任务缺乏高质量大规模三元组数据(具有风格化真实值)的问题,以支持模型训练与评估。

构建方法

  1. 数据来源:从高质量公共照片数据集中收集图像。
  2. 预处理:对图像进行归一化,以消除预先存在的色调偏差。
  3. 风格化处理:使用精心策划的专业预设对图像进行编辑。
  4. 质量过滤:通过专用的色调风格评分器和美学模型联合过滤生成的对,确保每个三元组在色调上一致且视觉上吸引人。

数据集构成与特点

  • TST100K:包含100,000个三元组。
  • TST2K
    • 是一个手动策划的基准数据集。
    • 包含具有代表性的图像类别:人像、食物、风景、夜景和生活方式摄影。
    • 涵盖了广泛的语义结构和光照条件。

相关模型与工具

  • 色调风格评分器:一个两阶段评分器,用于测量色调相似性、过滤噪声三元组,并在模型优化过程中作为奖励信号。
  • ICTone框架:一个基于扩散的框架,以上下文方式执行色调迁移,通过联合调节内容和参考图像,利用生成模型的语义先验进行语义感知的迁移。

实验验证

  • 定量评估:在TST2K基准上,ICTone在内容保持、色差、深度色差和美学质量方面取得了最佳总体结果。
  • 定性评估:与现有方法相比,ICTone能更好地保持自然的肤色、色彩层次、光照一致性和场景语义。
  • 用户研究:人工评估将ICTone排名第一,反映了其在结构保真度、色调一致性和视觉吸引力之间的良好平衡。

引用与资源

  • 论文:https://dengyuhai.github.io/ICTone_Project/
  • 代码:即将发布
  • 数据集:即将发布
搜集汇总
数据集介绍
main_image_url
构建方式
在计算摄影学领域,高质量配对数据的稀缺长期制约着色调风格迁移模型的性能。为突破这一瓶颈,TST100K数据集通过一套精心设计的数据构建流程得以创建。该流程首先从多个公开数据集中收集高质量图像,并应用经过筛选的预设色调模板生成初始候选对。核心创新在于训练了一个两阶段的色调风格评分器:第一阶段利用预设生成的弱监督对比学习捕捉粗粒度色调表征;第二阶段基于人工排序数据进行偏好学习微调,以对齐人类感知。随后,该评分器与美学评估模型协同工作,对候选对进行双重约束过滤,确保最终构建的十万个内容-参考-风格化三元组在色调一致性与视觉质量上均达到高标准。
使用方法
该数据集主要服务于色调风格迁移模型的监督训练与基准测试。研究人员可利用其大规模三元组数据,以端到端的方式训练模型学习从内容图像到参考图像的色调映射关系。具体而言,模型以内容图像和参考图像作为联合输入,并以对应的风格化真值作为监督目标进行优化。此外,数据集附带的TST2K精选基准子集可用于模型性能的定量评估与横向比较,评估指标涵盖内容保持度、色彩差异、深度色彩差异及美学质量等多个维度。基于该数据集训练的模型,如论文中提出的ICTone框架,能够实现语义感知的、高质量的色调迁移,在保持内容结构完整性的同时,精准地复现参考图像的色调风格。
背景与挑战
背景概述
TST100K数据集由南开大学与OPPO AI中心的研究团队于2026年提出,旨在解决图像处理领域中色调风格迁移任务缺乏大规模高质量标注数据的问题。该数据集包含十万组内容-参考-风格化三元组,为监督式学习提供了精确的地面真实标注,推动了计算摄影与图像编辑技术的发展。其核心研究问题在于如何实现语义感知的色调迁移,即在保持内容图像结构完整性的同时,将参考图像的色调分布、亮度与对比度等摄影美学属性进行精准转移。该数据集的构建不仅填补了现有数据资源的空白,还为基于生成模型的高级视觉任务奠定了坚实基础。
当前挑战
TST100K数据集面临的挑战主要体现在两大方面。在领域问题层面,色调风格迁移需克服语义对齐的难题,传统方法因独立编码内容与参考特征导致语义丢失,常引发色彩误传与视觉美感下降,例如将物体色调错误映射至人脸区域。在构建过程层面,数据创建需在质量与规模间取得平衡:人工修饰精度高但成本昂贵,预设滤镜扩展性强却会引入感知不一致的噪声三元组。为此,研究团队设计了两阶段训练的色调风格评分器,通过弱监督对比学习与人类排序微调,确保了参考与风格化图像间的严格风格一致性,并引入美学模型过滤低质量样本,从而实现了大规模高质量数据集的可靠构建。
常用场景
经典使用场景
在计算摄影与图像编辑领域,色调风格迁移旨在将参考图像的色彩分布、亮度、对比度等摄影美学属性迁移至内容图像,同时保持其语义内容与结构完整性。TST100K数据集通过提供十万组内容-参考-风格化三元组,为监督式训练奠定了数据基础。其经典使用场景聚焦于训练与评估先进的色调迁移模型,例如基于扩散的ICTone框架,该框架利用大规模生成模型的语义先验,以上下文生成方式实现精准且结构感知的色调转换。
解决学术问题
长期以来,色调风格迁移研究受限于高质量配对数据的匮乏,迫使现有方法依赖自监督或代理目标,制约了模型性能。TST100K的构建直接解决了这一核心瓶颈,为领域提供了首个大规模、带有风格化真值的三元组数据集。它不仅支持全监督训练,显著提升模型在色彩差异、内容保持和美学质量等指标上的表现,还通过引入色调风格评分器,为衡量图像间色调相似性提供了可靠度量,从而推动了模型在语义感知与风格保真度方面的突破。
实际应用
在实际应用中,TST100K数据集支撑的色调迁移技术已广泛应用于专业摄影后期、社交媒体图像美化以及个性化内容创作等领域。例如,摄影师可借助基于该数据集训练的模型,快速将特定场景(如肖像、风景、夜景)的色调风格适配到不同内容图像上,实现高效且风格一致的批量修图。此外,该技术也能集成至移动端图像处理应用,为用户提供一键式智能调色功能,显著提升视觉内容的审美品质与创作效率。
数据集最近研究
最新研究方向
在计算摄影与图像编辑领域,色调风格迁移旨在将参考图像的摄影美学属性(如色彩分布、亮度、对比度)迁移至内容图像,同时保持其语义内容与结构完整性。TST100K数据集的推出,通过构建首个大规模内容-参考-风格化三元组数据集,解决了该领域长期缺乏高质量标注数据的问题,推动了监督学习范式的革新。前沿研究聚焦于基于扩散模型的上下文生成框架(如ICTone),其将内容与参考图像作为联合上下文输入,利用生成模型的语义先验实现语义感知的色调迁移,并结合奖励反馈学习优化风格保真度。这一方向不仅显著提升了跨场景迁移的准确性与视觉美感,也为摄影级真实感风格迁移设立了新的性能基准,促进了图像编辑技术向智能化、个性化方向发展。
相关研究论文
  • 1
    Towards In-Context Tone Style Transfer with A Large-Scale Triplet Dataset南开大学·计算机科学与技术学院; 南开国际先进研究院(深圳福田); OPPO公司·人工智能中心 · 2026年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作