CTFilm20K
收藏arXiv2020-12-17 更新2024-06-21 收录
下载链接:
https://anonymous.4open.science/r/e6b1f6e3-9b36-423f-a22555b7d0b55523/
下载链接
链接失效反馈官方服务:
资源简介:
CTFilm20K数据集是由中国科学院计算技术研究所创建的首个大规模CT胶片数据库,包含约20,000张图片。该数据集利用Blender软件模拟真实世界中的变形场景,记录了与几何变形和光照变化相关的详细信息,如3D坐标、深度、法线和UV贴图。数据集的创建过程涉及高质量背景图像和CT数据的收集,以及使用逼真的渲染技术生成图像。CTFilm20K数据集主要用于CT胶片恢复研究,旨在解决胶片图像因几何变形和光照变化而导致的质量问题,支持医疗图像分析和远程咨询的需求。
CTFilm20K is the first large-scale CT film database developed by the Institute of Computing Technology, Chinese Academy of Sciences, containing approximately 20,000 images. This dataset utilizes Blender software to simulate real-world deformation scenarios, and records detailed information related to geometric deformations and illumination variations, including 3D coordinates, depth values, normal maps, and UV maps. The construction process of the dataset involves the collection of high-quality background images and CT data, as well as the generation of images via realistic rendering techniques. The CTFilm20K dataset is primarily applied to CT film restoration research, aiming to address the quality issues of film images induced by geometric deformations and illumination variations, and supports the requirements of medical image analysis and remote consultation.
提供机构:
中国科学院计算技术研究所
创建时间:
2020-12-17
搜集汇总
数据集介绍

构建方式
CTFilm20K数据集的构建方式是通过计算机图形渲染技术模拟真实世界的弯曲场景。研究人员从公共的医学CT DICOM数据集中提取切片,并将其转换为网格格式以生成胶片纹理。然后,使用Blender渲染软件中的物理计算引擎模拟不同的变形情况,并使用路径追踪在多种HDR场景中渲染图像。每个样本包含多个标签图,包括3D坐标图、法线图、深度图、UV图、反照率图和背景掩码。最终,从UV图计算反向映射,用于恢复弯曲的CT胶片。
特点
CTFilm20K数据集的特点是它包含了大约20,000张高质量、丰富注释的胶片图像,涵盖了各种真实世界的弯曲场景和不同的内容。与现有的文档图像恢复数据集相比,CTFilm20K数据集提供了更多类型的像素级图像地面真实数据,包括多种与几何相关的图和光照相关的掩码。此外,该数据集通过模拟变形过程,为学习的深度模型提供了更好的泛化能力。
使用方法
CTFilm20K数据集可用于训练深度学习模型,以恢复弯曲的CT胶片。数据集中的图像和标签图可以用于训练和评估深度学习模型的性能。研究人员可以使用该数据集来训练和测试他们的算法,以实现高质量的CT胶片恢复。此外,该数据集还可以用于研究CT胶片恢复问题的其他方面,例如光照变化和几何变形的解耦。
背景与挑战
背景概述
CTFilm20K数据集是首个专注于CT胶片恢复的大规模数据库,由中国科学院计算技术研究所的研究团队创建。该数据集旨在解决医疗影像领域中的一个问题:尽管医学影像如CT通常存储在医院PACS系统的DICOM格式中,但在许多国家,打印胶片作为可传输媒介进行自我存储和二次咨询仍很常见。随着手机摄像头的普及,拍摄CT胶片图片变得普遍,但这些图片往往因为几何变形和光照变化而无法满足医生处理和分析的标准。CTFilm20K数据集包含了大约20,000张图片,每张图片都伴有与几何变形(如3D坐标、深度、法线、UV映射)和光照变化(如反射率映射)相关的信息。该数据集的创建为研究CT胶片恢复问题提供了重要的资源和工具,对于推动CT胶片恢复技术的研究和发展具有重要意义。
当前挑战
CTFilm20K数据集和相关的研究面临的主要挑战包括:1)如何有效地解决CT胶片恢复中的几何变形和光照变化问题,确保恢复后的图片满足医生处理和分析的标准;2)如何构建一个包含多种真实世界扭曲场景和不同内容的CT胶片数据集,以提高模型的泛化能力;3)如何设计一个深度学习框架,利用多种映射图(如3D坐标图、法线图、UV映射图、反射率映射图)协同指导恢复过程,从而实现高精度和高效率的CT胶片恢复。
常用场景
经典使用场景
在医疗影像领域,CTFilm20K数据集被广泛应用于CT胶片的恢复。由于CT胶片在传输和存储过程中容易受到几何形变和光照变化的影响,导致其图像质量下降,难以进行精确的医学诊断。CTFilm20K数据集通过提供大量经过标注的CT胶片图像,以及与之相关的几何形变和光照变化信息,为研究人员提供了宝贵的数据资源。研究人员可以利用这些数据训练深度学习模型,实现CT胶片的自动恢复,从而提高医学影像的诊断准确性。
实际应用
CTFilm20K数据集在实际应用中具有广泛的价值。通过利用深度学习模型进行CT胶片的自动恢复,可以大大提高医学影像的诊断效率和质量。例如,在远程医疗中,患者可以将CT胶片拍照后发送给医生,医生利用CTFilm20K数据集训练的模型进行恢复,从而实现远程诊断。此外,CTFilm20K数据集还可以用于医学影像的教学和科研,为相关领域的研究人员提供宝贵的数据资源。
衍生相关工作
CTFilm20K数据集的发布推动了CT胶片恢复领域的研究进展。基于CTFilm20K数据集,研究人员提出了多种深度学习模型,如FiReNet等,实现了CT胶片的自动恢复。这些模型的提出不仅提高了CT胶片的恢复效果,而且为医学影像的诊断和分析提供了新的思路。此外,CTFilm20K数据集还衍生出了一系列相关的研究工作,如CT胶片的三维重建、光照估计等,进一步推动了医学影像领域的发展。
以上内容由遇见数据集搜集并总结生成



