SDU-SCICD10K
收藏arXiv2025-02-21 更新2025-02-25 收录
下载链接:
https://github.com/SunshineSki/Screen-contentimage-dataset/tree/main/SDU-SCICD10K
下载链接
链接失效反馈官方服务:
资源简介:
SDU-SCICD10K数据集是由山东大学构建的一个大规模屏幕内容图像压缩数据集,包含超过10,000张图像。该数据集分为三类:网页和办公图像、计算机渲染图像以及自然场景和屏幕内容混合图像,覆盖了PC和移动平台上的多种图像风格。数据集的构建旨在为屏幕内容图像压缩研究提供丰富的训练和测试资源,以解决当前屏幕内容图像压缩中存在的学习紧凑潜在特征、自适应量化步长调整以及缺乏大规模数据集等关键问题。
The SDU-SCICD10K dataset is a large-scale screen content image compression dataset constructed by Shandong University, containing over 10,000 images. This dataset is divided into three categories: web and office images, computer-rendered images, and mixed images of natural scenes and screen content, covering a variety of image styles on both PC and mobile platforms. The dataset is developed to provide rich training and test resources for screen content image compression research, so as to address the key problems existing in current screen content image compression, including learning compact latent features, adaptive quantization step size adjustment, and the lack of large-scale datasets.
提供机构:
山东大学
创建时间:
2025-02-21
搜集汇总
数据集介绍

构建方式
SDU-SCICD10K数据集的构建旨在应对屏幕内容图像压缩的三个关键挑战:学习紧凑的潜在特征、适应量化步长和缺乏大规模屏幕内容数据集。为了解决这些挑战,研究人员提出了一个新颖的压缩方法,该方法采用多频率两阶段八度残差块(MToRB)进行特征提取,级联三尺度特征融合残差块(CTSFRB)进行多尺度特征整合,以及多频率上下文交互模块(MFCIM)来减少频率间的相关性。此外,还引入了一个自适应量化模块,该模块为每个频率分量学习缩放均匀噪声,以实现量化粒度的灵活控制。最后,构建了一个大规模的屏幕内容图像压缩数据集(SDU-SCICD10K),该数据集包含超过10,000张图像,涵盖了基本的屏幕内容图像、计算机渲染图像以及来自PC和移动平台的混合自然场景和屏幕内容图像。
特点
SDU-SCICD10K数据集的特点在于其多样性、大规模和广泛性。数据集包含来自PC和移动平台的超过10,000张图像,涵盖了基本的屏幕内容图像、计算机渲染图像以及混合自然场景和屏幕内容图像。这使得数据集能够满足学习基于屏幕内容图像压缩的需求,并为研究人员提供了丰富的训练数据。此外,SDU-SCICD10K数据集的构建考虑了屏幕内容图像的独特属性,如锐利的边缘、重复的模式、嵌入的文本和图形,这使得数据集能够更好地反映屏幕内容图像的实际情况。
使用方法
使用SDU-SCICD10K数据集的方法包括以下步骤:1. 数据预处理:对数据集进行清洗和标准化,以确保数据质量。2. 数据增强:通过旋转、缩放、裁剪等操作对数据集进行增强,以提高模型的泛化能力。3. 模型训练:使用数据集训练图像压缩模型,如LIC方法。4. 模型评估:使用PSNR、MS-SSIM等指标评估模型的压缩性能。5. 模型优化:根据评估结果对模型进行调整和优化,以提高模型的压缩性能。6. 应用:将训练好的模型应用于实际的屏幕内容图像压缩任务,如网页、文档、游戏等。
背景与挑战
背景概述
在数字设备日益普及和屏幕内容生成与消费激增的背景下,有效处理和压缩屏幕内容(SC)图像成为一项重要任务。SDU-SCICD10K数据集的创建旨在解决当前屏幕内容图像压缩领域的关键挑战。该数据集由山东大学控制科学与工程学院的Shiqi Jiang、Hui Yuan、Shuai Li、Huanqiang Zeng和香港岭南大学数据科学学院的Sam Kwong等研究人员于2020年9月提出。该数据集包括超过10,000张图像,涵盖了基本屏幕内容图像、计算机渲染图像以及混合的自然场景和屏幕内容图像,来自PC和移动平台。该数据集的创建不仅为学习型图像压缩方法提供了丰富的训练数据,而且为评估和比较不同图像压缩算法的性能提供了一个标准平台。
当前挑战
SDU-SCICD10K数据集及相关研究面临的主要挑战包括:1) 学习紧凑的潜在特征;2) 适应量化步长;3) 缺乏大规模的屏幕内容图像压缩数据集。为了应对这些挑战,研究人员提出了一个基于多频率分解和自适应量化的屏幕内容图像压缩方法。该方法使用多频率两级八度残差块(MToRB)进行特征提取,级联三尺度特征融合残差块(CTSFRB)进行多尺度特征整合,并引入多频率上下文交互模块(MFCIM)以减少频率间的相关性。此外,还引入了一个自适应量化模块,该模块为每个频率组件学习缩放均匀噪声,从而实现对量化粒度的灵活控制。
常用场景
经典使用场景
SDU-SCICD10K数据集被广泛应用于屏幕内容图像压缩的研究中。它包含了超过10,000张图像,涵盖了基本的屏幕内容图像、计算机渲染图像以及来自PC和移动平台的混合自然场景和屏幕内容图像。这些图像具有鲜明的特征,如锐利的边缘、重复的图案、嵌入的文本和图形。该数据集为研究者提供了一个丰富多样的数据源,使得他们可以训练和评估新的图像压缩算法,从而在屏幕内容图像压缩领域取得突破性进展。
实际应用
SDU-SCICD10K数据集在实际应用中具有广泛的应用前景。随着数字设备的普及和屏幕内容活动的增加,对屏幕内容图像的压缩需求也越来越大。SDU-SCICD10K数据集可以用于训练和评估新的图像压缩算法,从而实现更高效的屏幕内容图像压缩。此外,该数据集还可以用于其他相关领域的研究,如屏幕内容图像质量评估和屏幕内容图像识别。
衍生相关工作
SDU-SCICD10K数据集的构建为屏幕内容图像压缩领域的研究提供了重要的数据支持。基于该数据集,研究者可以训练和评估新的图像压缩算法,从而在屏幕内容图像压缩领域取得突破性进展。此外,该数据集还可以用于其他相关领域的研究,如屏幕内容图像质量评估和屏幕内容图像识别。基于SDU-SCICD10K数据集的研究成果可以进一步推动屏幕内容图像压缩领域的发展,并为其他相关领域的研究提供重要的参考和启示。
以上内容由遇见数据集搜集并总结生成



