RealScene-ISTD
收藏arXiv2025-04-23 更新2025-04-25 收录
下载链接:
https://github.com/luy0222/RealScene-ISTD
下载链接
链接失效反馈官方服务:
资源简介:
RealScene-ISTD是由广东工业大学信息工程学院创建的一个新型跨域红外小目标数据集,旨在促进模型在跨域数据条件下的泛化研究以及现有红外小目标检测算法在真实世界环境中的性能优化。该数据集包含了多种形状、类别、姿态和来自多个来源的传感器模态,为评估模型在跨域中的泛化能力和推动红外小目标检测算法在真实世界应用中的性能提升提供了基准。
RealScene-ISTD is a novel cross-domain infrared small target dataset developed by the School of Information Engineering, Guangdong University of Technology. It aims to facilitate research on model generalization under cross-domain data conditions and optimize the performance of existing infrared small target detection algorithms in real-world environments. This dataset encompasses diverse shapes, categories, poses and sensor modalities from multiple sources, providing a benchmark for evaluating the cross-domain generalization capability of models and advancing the performance enhancement of infrared small target detection algorithms in real-world applications.
提供机构:
广东工业大学信息工程学院
创建时间:
2025-04-23
搜集汇总
数据集介绍

构建方式
RealScene-ISTD数据集的构建过程体现了对红外小目标检测领域复杂性的深刻理解。研究团队从公开平台收集了739张高质量红外无人机图像,覆盖了真实场景中的多样化环境。所有图像均经过人工精确裁剪和像素级标注,确保了标注的准确性和一致性。为增强数据集的代表性,图像尺寸统一标准化为540×420分辨率,并包含三种不同尺度的目标(微小、常规、大型),这些目标通过不同角度和距离的红外摄像机捕捉,形成了丰富的视角变化。数据集还涵盖了目标在复杂背景下的多种运动状态,包括静止、匀速运动和变速运动,显著提升了目标边缘检测的难度。
使用方法
该数据集支持端到端的模型训练与跨域性能验证。研究者可将NUAA-SIRST、IRSTD-1K等现有数据集与本数据集联合训练,通过提出的跨视图通道对齐(CCA)策略消除域间分布差异。具体使用时,建议采用论文中的噪声引导表征学习策略:在输入图像中注入随机噪声(推荐超参数α=0.6)来模拟不同传感器的热辐射变化,通过最小化干净图像与噪声图像的全局特征距离(公式8),使模型学习噪声鲁棒性特征。评估阶段应采用综合指标,包括衡量形状描述能力的IoU、检测概率Pd与虚警率Fa,特别注意模型在边缘区域的预测精度。数据集配套的Top-K泊松融合工具可生成具有丰富背景-目标组合的增强样本,有效缓解数据冗余问题。
背景与挑战
背景概述
RealScene-ISTD是由广东工业大学卢亚豪、李月辉等学者于2025年提出的红外小目标检测基准数据集,旨在解决复杂真实场景下因传感器类型、观测条件和目标特性差异导致的域偏移问题。该数据集包含739张无人机拍摄的高质量红外图像,涵盖不同尺度目标、多运动状态及复杂背景干扰,并采用像素级标注。作为首个面向跨域泛化研究的ISTD数据集,其通过融合NUAA-SIRST、IRSTD-1K等多源数据,推动了红外目标检测算法在安防监控、自动驾驶等实际场景中的应用。
当前挑战
该数据集主要面临三方面挑战:在领域问题层面,红外小目标的低信噪比特性与复杂背景干扰导致传统检测方法在跨域场景下泛化性能骤降;构建过程中需克服多源数据间的灰度分布差异,通过伽马校正实现跨传感器通道对齐;此外,数据标注需解决微小目标(如3×3像素)的精准定位问题,并设计泊松融合策略生成多样化的背景-目标组合样本以增强数据代表性。噪声鲁棒性学习策略的引入进一步提高了模型对传感器热噪声的适应能力。
常用场景
经典使用场景
RealScene-ISTD数据集在红外小目标检测(ISTD)领域中被广泛用于评估模型在复杂真实场景下的泛化能力。该数据集通过整合多源传感器采集的无人机红外图像,涵盖了不同尺度、姿态及背景干扰的目标样本,为研究跨域分布偏移问题提供了标准化测试平台。其典型应用包括对比传统滤波算法与深度学习方法在目标轮廓重建、噪声抑制等方面的性能差异,尤其在低信噪比条件下的小目标定位任务中展现出关键价值。
解决学术问题
该数据集有效解决了红外小目标检测中因传感器差异、环境噪声和样本分布偏移导致的模型泛化瓶颈。通过提供跨域对齐的标注数据,支持了领域自适应策略(如跨视角通道对齐和噪声引导表征学习)的验证,显著提升了现有算法在IoU、检测概率(Pd)与虚警率(Fa)等指标上的表现。其构建填补了真实场景下多源异构数据评估体系的空白,推动了噪声鲁棒性特征学习理论的发展。
实际应用
RealScene-ISTD在安防监控、无人机搜救、自动驾驶等实际场景中具有重要应用价值。例如,在夜间搜救任务中,该数据集训练的模型能够准确识别远距离微弱热源目标;在电力巡检领域,可有效检测高压线路上的微小故障点。其跨域对齐特性尤其适用于需适配不同红外传感器型号的工业检测系统,显著降低了设备切换时的模型调优成本。
数据集最近研究
最新研究方向
红外小目标检测(ISTD)领域近年来在跨域泛化与噪声鲁棒性方面取得了显著进展。RealScene-ISTD数据集的提出,为解决传感器差异、观测条件变化导致的数据分布偏移问题提供了新的研究范式。当前前沿聚焦于三个方向:一是跨视角表征学习,通过通道对齐(CCA)和Top-K融合策略实现多源数据分布适配;二是噪声引导的特征学习机制,利用热噪声扰动增强模型在复杂环境中的泛化能力;三是面向真实场景的基准构建,该数据集涵盖无人机多尺度目标、多样化背景及动态运动状态,为算法在安防监控、灾害救援等实际应用中的性能评估提供了标准化平台。相关技术突破显著提升了模型在交叉数据集测试中的IoU(79.32%)和检测概率(96.83%),同时将虚警率降至5.4×10^-6,推动了红外探测技术从实验室向真实场景的落地转化。
相关研究论文
- 1Rethinking Generalizable Infrared Small Target Detection: A Real-scene Benchmark and Cross-view Representation Learning广东工业大学信息工程学院 · 2025年
以上内容由遇见数据集搜集并总结生成



