five

InStereo2K

收藏
github2024-05-16 更新2024-05-31 收录
下载链接:
https://github.com/YuhuaXu/StereoDataset
下载链接
链接失效反馈
官方服务:
资源简介:
InStereo2K是一个大型真实室内场景立体匹配数据集,包含2050对具有高精度视差图的图像(2000对用于训练,50对用于测试)。该数据集旨在提高深度立体匹配网络的泛化性能。

InStereo2K is a large-scale real-world indoor scene stereo matching dataset, comprising 2050 pairs of images with high-precision disparity maps (2000 pairs for training and 50 pairs for testing). This dataset is designed to enhance the generalization performance of deep stereo matching networks.
创建时间:
2019-05-20
原始信息汇总

数据集概述

InStereo2K包含2050对室内场景的图像及其高精度视差图,其中2000对用于训练,50对用于测试。该数据集旨在提升深度立体匹配网络的泛化性能。

数据格式

  • 视差图以16位PNG格式存储,原始浮点型视差值放大100倍并四舍五入以保持子像素精度。
  • 无效视差值设为零,在训练过程中应排除这些无效像素。
  • 推荐使用最近邻插值进行数据集增强。

评估

  • 使用InStereo2K微调的iResNet模型的bad2.0错误率为18.5。
  • 使用InStereo2K微调的DeepPruner模型的bad2.0错误率为16.5。

下载

  • 百度网盘:https://pan.baidu.com/s/160BB5bfs0oABLqwJjZzYiA,提取码:9qwt
  • OneDrive链接:
    • https://1drv.ms/u/s!AhORN5PjOtgJgQVku2DVLD8Xaqkk?e=9DTd0n
    • https://1drv.ms/u/s!AoQcUQo52MO6aFIMqKJKDmzCxuQ?e=D8G0zi

许可证

该数据集可免费提供给学术和非学术实体,用于非商业目的,如学术研究、教学、科学出版或个人实验。

搜集汇总
数据集介绍
main_image_url
构建方式
InStereo2K数据集的构建基于室内场景的立体匹配需求,精心收集并标注了2050对高精度视差图的图像对,其中2000对用于训练,50对用于测试。为确保视差图的亚像素精度,原始浮点视差值被放大100倍并四舍五入,最终以16位PNG格式存储。这种处理方式不仅保留了数据的精确性,还为后续的深度学习模型提供了高质量的训练数据。
特点
InStereo2K数据集的显著特点在于其高精度的视差图和大规模的真实室内场景图像对。数据集的视差图经过特殊处理,确保了亚像素级别的精度,这对于提升立体匹配算法的泛化能力至关重要。此外,数据集的多样性和真实性使其成为评估和改进深度立体匹配网络的理想选择。
使用方法
在使用InStereo2K数据集时,用户需将存储的视差值除以100以恢复其原始比例。对于无效的视差值(设置为零),在训练过程中应予以剔除。若需通过调整图像大小来增强数据集的视差范围,建议采用最近邻插值法以保持视差值的准确性。数据集可通过百度网盘或OneDrive链接进行下载,适用于学术研究和非商业用途。
背景与挑战
背景概述
InStereo2K数据集由Wei Bao、Wei Wang、Yuhua Xu、Yulan Guo、Siyu Hong和Xiaohu Zhang等研究人员于2020年创建,旨在为室内场景中的立体匹配问题提供一个大规模的真实数据集。该数据集包含2050对高精度视差图的图像对,其中2000对用于训练,50对用于测试。其核心研究问题在于提升深度立体匹配网络的泛化性能,尤其是在未见过的数据集上的表现。InStereo2K的发布对立体匹配领域的研究具有重要意义,为研究人员提供了一个高质量的基准数据集,有助于推动该领域的技术进步。
当前挑战
InStereo2K数据集在构建过程中面临了多个挑战。首先,确保视差图的高精度是关键,为此,原始浮点视差图被放大100倍并存储为16位PNG格式,使用时需进行缩放处理。其次,数据集中的无效视差点需要被剔除,以确保训练过程的准确性。此外,在数据增强过程中,推荐使用最近邻插值以避免视差范围的失真。在应用层面,如何有效利用该数据集提升深度学习模型的泛化能力,尤其是在未见数据上的表现,仍然是一个重要的研究挑战。
常用场景
经典使用场景
InStereo2K数据集在室内场景的双目匹配任务中展现了其经典应用价值。该数据集包含了2050对高精度视差图的图像对,为深度学习模型提供了丰富的训练和测试资源。通过利用这些高质量的视差图,研究者能够训练和验证双目匹配算法,特别是在室内复杂环境下的深度估计和物体识别任务中,显著提升了模型的泛化能力和精度。
解决学术问题
InStereo2K数据集有效解决了室内场景中双目匹配算法的泛化性能问题。传统的双目匹配算法在面对复杂室内环境时,往往难以保持高精度和稳定性。该数据集通过提供大规模的真实室内场景数据,帮助研究者开发和优化深度学习模型,从而在未见过的数据上也能表现出优异的性能。这不仅推动了双目视觉技术的发展,也为相关领域的研究提供了坚实的基础。
衍生相关工作
InStereo2K数据集的发布激发了大量相关研究工作,特别是在深度学习与双目视觉的交叉领域。许多研究者基于该数据集开发了新的深度学习模型,如iResNet和DeepPruner,这些模型在双目匹配任务中表现出色。此外,该数据集还被用于探索多尺度特征提取、自适应视差估计等前沿技术,进一步推动了双目视觉技术的理论和应用研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作