five

InStereo2K

收藏
github2022-05-17 更新2024-05-31 收录
下载链接:
https://github.com/Gary66/StereoDataset
下载链接
链接失效反馈
官方服务:
资源简介:
InStereo2K是一个大型的室内场景立体匹配真实数据集,包含2050对高精度视差图(2000对用于训练,50对用于测试)。该数据集旨在提高深度立体匹配网络的泛化性能。

InStereo2K is a large-scale real-world dataset for stereo matching in indoor scenes, comprising 2050 pairs of high-precision disparity maps (2000 pairs for training and 50 pairs for testing). This dataset is designed to enhance the generalization performance of deep stereo matching networks.
创建时间:
2020-02-28
原始信息汇总

InStereo2K数据集概述

数据集内容

  • 包含2050对室内场景的图像及其高精度视差图。
  • 训练集包含2000对图像,测试集包含50对图像。

数据格式

  • 视差图为了保持子像素精度,原始浮点视差图放大100倍并四舍五入,最终存储为16位PNG格式。
  • 使用时需将视差值除以100以获得正确比例。
  • 无效视差值设为零,训练过程中应排除这些无效像素。
  • 若通过调整大小来增强数据集的视差范围,推荐使用最近邻插值。

评估

  • 使用iResNet微调后的bad2.0错误率为18.5。
  • 使用DeepPruner微调后的bad2.0错误率为16.5。
  • 微调过程中未使用Middlebury训练集,可视为未见数据集。

下载信息

联系方式

  • 邮箱:xyh_nudt@163.com
搜集汇总
数据集介绍
main_image_url
构建方式
InStereo2K数据集专注于室内场景的立体匹配任务,其构建过程基于高精度的视差图生成。数据集包含2050对图像,其中2000对用于训练,50对用于测试。为了保持亚像素级别的精度,原始浮点视差图被放大100倍并四舍五入,最终以16位PNG格式存储。无效视差值被设置为零,训练过程中需排除这些无效像素。
特点
InStereo2K数据集的特点在于其大规模和高精度。数据集提供了丰富的室内场景图像对,每对图像均配有高精度的视差图,能够有效提升深度立体匹配网络的泛化性能。视差图以16位PNG格式存储,确保了数据的精确性。此外,数据集的构建方式使得其在处理无效像素时具有较高的灵活性,适合用于复杂的立体匹配任务。
使用方法
使用InStereo2K数据集时,需将存储的视差值除以100以恢复其原始尺度。训练过程中,应排除无效像素以确保模型的准确性。若需增强数据集的视差范围,建议采用最近邻插值法进行图像缩放。数据集已成功应用于多个立体匹配模型的微调,如iResNet和DeepPruner,并在未见过的数据集上表现出色。
背景与挑战
背景概述
InStereo2K数据集由Wei Bao等研究人员于2020年发布,旨在为室内场景的立体匹配任务提供大规模、高质量的数据支持。该数据集包含2050对图像及其对应的高精度视差图,其中2000对用于训练,50对用于测试。通过提供真实场景中的立体图像对,InStereo2K显著提升了深度立体匹配网络的泛化性能,推动了计算机视觉领域在三维重建、机器人导航等应用中的发展。其研究成果发表于《SCIENCE CHINA Information Sciences》,为相关领域的研究提供了重要的数据基础。
当前挑战
InStereo2K数据集在解决立体匹配问题时面临多重挑战。首先,立体匹配任务本身对图像的视差计算精度要求极高,尤其是在复杂室内场景中,光照变化、遮挡和纹理缺失等问题会显著增加匹配难度。其次,数据集的构建过程中,如何确保视差图的高精度和一致性是一个关键挑战,研究人员通过将原始浮点视差图放大100倍并存储为16位PNG格式来解决这一问题。此外,数据集中无效视差值的处理以及数据增强时的插值方法选择也对模型的训练效果产生了重要影响。这些挑战不仅考验了数据集的构建质量,也对后续算法的鲁棒性和精度提出了更高要求。
常用场景
经典使用场景
InStereo2K数据集在立体匹配领域具有广泛的应用,尤其是在室内场景的深度估计中。该数据集通过提供高精度的视差图,为深度学习模型的训练和验证提供了丰富的素材。研究人员可以利用这些数据来优化立体匹配算法,提升模型在复杂室内环境中的表现。
衍生相关工作
InStereo2K数据集催生了一系列经典的立体匹配算法研究。例如,基于该数据集,研究人员提出了iResNet和DeepPruner等模型,这些模型在立体匹配任务中表现出色,进一步推动了该领域的发展。此外,该数据集还为其他相关研究提供了基准,促进了立体匹配技术的不断创新。
数据集最近研究
最新研究方向
在计算机视觉领域,立体匹配技术一直是研究的热点之一,尤其是在室内场景中的应用。InStereo2K数据集作为一个大规模的室内场景立体匹配数据集,包含了2050对高精度视差图,为深度学习模型提供了丰富的训练和测试资源。近年来,研究者们利用该数据集探索了多种先进的立体匹配算法,如iResNet和DeepPruner,这些算法在未使用Middlebury训练集的情况下,依然表现出色,显示出InStereo2K数据集在提升模型泛化能力方面的显著优势。随着虚拟现实和增强现实技术的快速发展,InStereo2K数据集的应用前景愈发广阔,其在室内场景重建、机器人导航等领域的潜力正逐步被挖掘。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作