five

Vimeo-90K|图像压缩数据集|数字病理学数据集

收藏
arXiv2024-12-18 更新2024-12-19 收录
图像压缩
数字病理学
下载链接:
http://arxiv.org/abs/2412.13137v1
下载链接
链接失效反馈
资源简介:
Vimeo-90K数据集是由德国癌症研究中心使用的基准数据集,主要用于评估深度学习模型在图像压缩中的表现。该数据集包含90000条未压缩的自然场景图像,涵盖了多种场景和动作,适用于训练和测试压缩算法。数据集的创建过程涉及对大量自然图像的收集和整理,旨在为图像压缩领域的研究提供一个标准化的评估平台。该数据集的应用领域主要集中在数字病理学中的图像压缩和质量评估,旨在解决病理图像文件大小过大和压缩质量之间的平衡问题。
提供机构:
德国癌症研究中心
创建时间:
2024-12-18
AI搜集汇总
数据集介绍
main_image_url
构建方式
Vimeo-90K数据集是通过收集大量未压缩的自然场景视频片段构建而成,这些视频片段涵盖了多种场景和动作。数据集的构建旨在为深度学习模型提供一个广泛且多样化的训练环境,确保模型在处理不同类型的图像时具有良好的泛化能力。数据集的收集过程避免了任何初始压缩,从而确保了数据的无偏性和高质量。
特点
Vimeo-90K数据集的主要特点在于其多样性和高质量。数据集包含了大量未压缩的视频片段,涵盖了多种自然场景和动作,为深度学习模型提供了丰富的训练数据。此外,数据集的未压缩特性使得其在评估压缩算法时能够提供更为准确的感知质量评估。
使用方法
Vimeo-90K数据集主要用于深度学习模型的预训练,特别是在图像压缩和视频处理领域。研究人员可以使用该数据集来训练和评估各种压缩算法,尤其是基于深度学习的压缩模型。通过在Vimeo-90K上进行预训练,模型能够学习到如何有效地压缩图像,同时保持较高的感知质量。
背景与挑战
背景概述
Vimeo-90K数据集是由Maximilian Fischer等人于2022年创建的,旨在评估数字病理学中的压缩方案。该数据集的核心研究问题是如何在保持诊断准确性的同时,有效减少病理全切片图像(WSI)的文件大小。由于WSI文件通常体积庞大,传统的JPEG压缩虽然广泛使用,但可能会引入颜色和纹理差异,影响临床决策。Vimeo-90K数据集的创建为无偏评估压缩方案提供了基础,推动了数字病理学在临床实践中的应用。
当前挑战
Vimeo-90K数据集面临的挑战主要集中在两个方面:一是如何在压缩过程中保持图像的感知质量和下游任务性能,尤其是在病理图像中,压缩带来的微小变化可能影响诊断准确性;二是构建过程中,如何处理不同压缩方案的泛化能力,避免模型对特定压缩方案的过度依赖。此外,数据集的构建还需要考虑计算资源的消耗和压缩方案的实时性,以确保其在临床应用中的可行性。
常用场景
经典使用场景
Vimeo-90K数据集在数字病理学领域中被广泛用于评估压缩方案的感知质量和下游任务性能。该数据集包含大量未压缩的病理图像,为研究者提供了一个无偏的评估平台,用于比较不同压缩算法在保持图像质量与诊断准确性方面的表现。通过该数据集,研究者可以系统地评估深度学习模型在压缩病理全片图像(WSI)时的表现,尤其是在感知质量和下游任务(如分类和分割)中的表现。
解决学术问题
Vimeo-90K数据集解决了数字病理学中一个关键的学术问题,即如何在保持诊断准确性的同时有效压缩病理全片图像(WSI)。传统的压缩方法如JPEG在压缩过程中可能引入颜色和纹理失真,影响临床决策。该数据集通过提供未压缩的病理图像,使得研究者能够评估不同压缩方案在感知质量和下游任务性能上的表现,推动了数字病理学中压缩技术的标准化评估。
衍生相关工作
Vimeo-90K数据集的发布催生了一系列相关的经典工作,特别是在深度学习压缩技术领域。例如,研究者基于该数据集开发了多种深度学习压缩模型,如基于变分自编码器(VAE)的压缩方案,这些模型在感知质量和下游任务性能上表现优异。此外,该数据集还推动了任务无关的下游性能评估指标的研究,为不同压缩方案的比较提供了标准化的方法,进一步促进了数字病理学中压缩技术的研究与发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录