UltraHR-100K
收藏github2025-10-24 更新2025-10-26 收录
下载链接:
https://github.com/NJU-PCALab/UltraHR-100k
下载链接
链接失效反馈官方服务:
资源简介:
UltraHR-100K是一个包含10万张超高分辨率图像的高质量数据集,每张图像分辨率超过3K,具有丰富的标题描述,提供多样化的内容和强大的视觉保真度。该数据集基于细节丰富度、内容复杂度和美学质量经过严格筛选,旨在解决超高分辨率文本到图像生成中缺乏大规模高质量数据集的问题。
UltraHR-100K is a high-quality dataset consisting of 100,000 ultra-high-resolution images. Each image has a resolution exceeding 3K, accompanied by rich caption descriptions, providing diverse content and excellent visual fidelity. This dataset was rigorously screened based on detail richness, content complexity and aesthetic quality, and aims to address the shortage of large-scale high-quality datasets for ultra-high-resolution text-to-image generation.
创建时间:
2025-10-24
原始信息汇总
UltraHR-100K 数据集概述
数据集简介
UltraHR-100K 是一个用于超高清图像合成的大规模高质量数据集,包含10万张超高清图像及丰富的文本描述。该数据集旨在解决超高清文本到图像生成领域缺乏大规模高质量训练数据的问题。
核心特征
- 图像规模:包含100,000张高质量图像
- 分辨率标准:每张图像分辨率均超过3K
- 质量筛选:基于细节丰富度、内容复杂度和美学质量进行严格筛选
- 内容多样性:提供多样化的图像内容和强大的视觉保真度
技术贡献
- 解决了超高清文本到图像生成领域缺乏大规模高质量数据集的问题
- 提出了频率感知的后训练方法,增强扩散模型在细粒度细节生成方面的能力
- 设计了面向细节的时间步采样和软加权频率正则化方法
数据集获取
- 主数据集:https://huggingface.co/datasets/zhihefang/UltraHR-100K
- 评估基准:https://huggingface.co/datasets/zhihefang/UltraHR-100K
学术认可
- 该工作已被NeurIPS 2025接收
- 相关实验在UltraHR-eval4K基准测试中验证了方法的有效性
引用信息
bibtex @article{sun2022shufflemixer, title={UltraHR-100K: Enhancing UHR Image Synthesis with A Large-Scale High-Quality Dataset}, author={Chen Zhao, En Ci, Yunzhe Xu, Tiehan Fan, Shanyan Guan, Yanhao Ge, Jian Yang, Ying Tai}, journal={Advances in Neural Information Processing Systems}, year={2025} }
搜集汇总
数据集介绍

构建方式
在超高清图像生成领域,数据质量直接影响模型性能。UltraHR-100K通过多维度筛选标准构建,从海量图像中精选超过10万张分辨率均高于3K的样本,每张图像均经过细节丰富度、内容复杂度与美学质量的系统评估。该流程采用人工与算法协同的标注机制,确保文本描述与视觉内容的高度契合,为模型训练提供精准的语义监督。
特点
作为当前规模最大的超高清文本-图像配对数据集,UltraHR-100K展现出显著的多样性特征。其图像内容涵盖自然景观、人文建筑、生物形态等多元主题,且所有样本均保持卓越的视觉保真度。数据集特别注重高频细节的完整性,通过严格的色彩校准与噪声控制,为超分辨率研究提供了理想的基准数据。
使用方法
研究者可通过HuggingFace平台直接获取数据集完整资源。使用前需配置PyTorch、Flash-Attn等深度学习环境,建议结合论文提出的频率感知后训练方法。该方案包含面向细节的时序采样策略与软加权频率正则化技术,能有效提升扩散模型在超高清场景下的细节生成能力,相关评估可参照配套的UltraHR-eval4K基准测试集。
背景与挑战
背景概述
在超高清文本到图像生成技术快速发展的背景下,南京大学PCALab团队于2025年发布了UltraHR-100K数据集,旨在解决该领域缺乏大规模高质量训练数据的关键瓶颈。该数据集包含十万张分辨率超过3K的精细标注图像,通过严格筛选机制确保内容多样性与视觉保真度,其构建融合了细节丰富度、内容复杂度与美学质量三重标准。作为NeurIPS 2025收录的重要成果,该数据集为突破生成模型在微观纹理合成方面的技术壁垒提供了坚实基础。
当前挑战
该数据集直面超高清图像合成领域的两大核心挑战:在领域问题层面,传统文本到图像模型难以在超高分辨率场景下保持细粒度细节的连贯性,易出现纹理模糊与结构失真;在构建过程中,需克服海量数据采集的规模瓶颈,通过多维度质量评估体系实现像素级精度的数据筛选,同时解决高频信息保留与计算负载平衡的技术难题。
常用场景
经典使用场景
在超高分辨率图像生成领域,UltraHR-100K数据集通过其超过3K分辨率的十万张高质量图像,为扩散模型训练提供了关键支撑。该数据集特别适用于文本到图像生成任务中细节增强的研究,其精心筛选的复杂场景与丰富纹理内容,成为评估模型在微观结构生成能力时的基准资源。研究者常利用该数据集探索模型在保持图像全局一致性的同时,如何精确还原高频细节的生成机制。
解决学术问题
该数据集有效解决了超高分辨率图像合成中数据稀缺与质量不足的核心难题。通过提供大规模高质量训练样本,显著缓解了现有模型在生成4K以上分辨率图像时出现的纹理模糊与结构失真问题。其配套的频率感知后训练方法,针对性地改善了扩散模型在细节合成阶段的性能,为突破生成图像视觉保真度的理论瓶颈提供了实证基础。该工作推动了生成模型在频域分析与细节建模方向的交叉研究。
衍生相关工作
基于该数据集衍生的频率感知训练框架已催生多项创新研究,包括改进的扩散模型采样策略与频域正则化方法。相关工作进一步拓展至视频超分辨率生成领域,推动了多尺度特征融合技术的发展。在NeurIPS 2025会议中,该数据集启发的多项研究对生成模型的训练动力学理论进行了深化,特别是在高频细节保留机制与人类视觉感知对齐方面取得了突破性进展。
以上内容由遇见数据集搜集并总结生成



