five

RealScene-ISTD|红外小目标检测数据集|跨域学习数据集

收藏
arXiv2025-04-23 更新2025-04-25 收录
红外小目标检测
跨域学习
下载链接:
https://github.com/luy0222/RealScene-ISTD
下载链接
链接失效反馈
资源简介:
RealScene-ISTD是由广东工业大学信息工程学院创建的一个新型跨域红外小目标数据集,旨在促进模型在跨域数据条件下的泛化研究以及现有红外小目标检测算法在真实世界环境中的性能优化。该数据集包含了多种形状、类别、姿态和来自多个来源的传感器模态,为评估模型在跨域中的泛化能力和推动红外小目标检测算法在真实世界应用中的性能提升提供了基准。
提供机构:
广东工业大学信息工程学院
创建时间:
2025-04-23
AI搜集汇总
数据集介绍
main_image_url
构建方式
RealScene-ISTD数据集的构建过程体现了对红外小目标检测领域复杂性的深刻理解。研究团队从公开平台收集了739张高质量红外无人机图像,覆盖了真实场景中的多样化环境。所有图像均经过人工精确裁剪和像素级标注,确保了标注的准确性和一致性。为增强数据集的代表性,图像尺寸统一标准化为540×420分辨率,并包含三种不同尺度的目标(微小、常规、大型),这些目标通过不同角度和距离的红外摄像机捕捉,形成了丰富的视角变化。数据集还涵盖了目标在复杂背景下的多种运动状态,包括静止、匀速运动和变速运动,显著提升了目标边缘检测的难度。
使用方法
该数据集支持端到端的模型训练与跨域性能验证。研究者可将NUAA-SIRST、IRSTD-1K等现有数据集与本数据集联合训练,通过提出的跨视图通道对齐(CCA)策略消除域间分布差异。具体使用时,建议采用论文中的噪声引导表征学习策略:在输入图像中注入随机噪声(推荐超参数α=0.6)来模拟不同传感器的热辐射变化,通过最小化干净图像与噪声图像的全局特征距离(公式8),使模型学习噪声鲁棒性特征。评估阶段应采用综合指标,包括衡量形状描述能力的IoU、检测概率Pd与虚警率Fa,特别注意模型在边缘区域的预测精度。数据集配套的Top-K泊松融合工具可生成具有丰富背景-目标组合的增强样本,有效缓解数据冗余问题。
背景与挑战
背景概述
RealScene-ISTD是由广东工业大学卢亚豪、李月辉等学者于2025年提出的红外小目标检测基准数据集,旨在解决复杂真实场景下因传感器类型、观测条件和目标特性差异导致的域偏移问题。该数据集包含739张无人机拍摄的高质量红外图像,涵盖不同尺度目标、多运动状态及复杂背景干扰,并采用像素级标注。作为首个面向跨域泛化研究的ISTD数据集,其通过融合NUAA-SIRST、IRSTD-1K等多源数据,推动了红外目标检测算法在安防监控、自动驾驶等实际场景中的应用。
当前挑战
该数据集主要面临三方面挑战:在领域问题层面,红外小目标的低信噪比特性与复杂背景干扰导致传统检测方法在跨域场景下泛化性能骤降;构建过程中需克服多源数据间的灰度分布差异,通过伽马校正实现跨传感器通道对齐;此外,数据标注需解决微小目标(如3×3像素)的精准定位问题,并设计泊松融合策略生成多样化的背景-目标组合样本以增强数据代表性。噪声鲁棒性学习策略的引入进一步提高了模型对传感器热噪声的适应能力。
常用场景
经典使用场景
RealScene-ISTD数据集在红外小目标检测(ISTD)领域中被广泛用于评估模型在复杂真实场景下的泛化能力。该数据集通过整合多源传感器采集的无人机红外图像,涵盖了不同尺度、姿态及背景干扰的目标样本,为研究跨域分布偏移问题提供了标准化测试平台。其典型应用包括对比传统滤波算法与深度学习方法在目标轮廓重建、噪声抑制等方面的性能差异,尤其在低信噪比条件下的小目标定位任务中展现出关键价值。
解决学术问题
该数据集有效解决了红外小目标检测中因传感器差异、环境噪声和样本分布偏移导致的模型泛化瓶颈。通过提供跨域对齐的标注数据,支持了领域自适应策略(如跨视角通道对齐和噪声引导表征学习)的验证,显著提升了现有算法在IoU、检测概率(Pd)与虚警率(Fa)等指标上的表现。其构建填补了真实场景下多源异构数据评估体系的空白,推动了噪声鲁棒性特征学习理论的发展。
实际应用
RealScene-ISTD在安防监控、无人机搜救、自动驾驶等实际场景中具有重要应用价值。例如,在夜间搜救任务中,该数据集训练的模型能够准确识别远距离微弱热源目标;在电力巡检领域,可有效检测高压线路上的微小故障点。其跨域对齐特性尤其适用于需适配不同红外传感器型号的工业检测系统,显著降低了设备切换时的模型调优成本。
数据集最近研究
最新研究方向
红外小目标检测(ISTD)领域近年来在跨域泛化与噪声鲁棒性方面取得了显著进展。RealScene-ISTD数据集的提出,为解决传感器差异、观测条件变化导致的数据分布偏移问题提供了新的研究范式。当前前沿聚焦于三个方向:一是跨视角表征学习,通过通道对齐(CCA)和Top-K融合策略实现多源数据分布适配;二是噪声引导的特征学习机制,利用热噪声扰动增强模型在复杂环境中的泛化能力;三是面向真实场景的基准构建,该数据集涵盖无人机多尺度目标、多样化背景及动态运动状态,为算法在安防监控、灾害救援等实际应用中的性能评估提供了标准化平台。相关技术突破显著提升了模型在交叉数据集测试中的IoU(79.32%)和检测概率(96.83%),同时将虚警率降至5.4×10^-6,推动了红外探测技术从实验室向真实场景的落地转化。
相关研究论文
  • 1
    Rethinking Generalizable Infrared Small Target Detection: A Real-scene Benchmark and Cross-view Representation Learning广东工业大学信息工程学院 · 2025年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

COVID-19 Data Hub

COVID-19 Data Hub是一个全球性的COVID-19数据集,包含了来自多个国家和地区的疫情数据,涵盖了病例数、死亡数、康复数、测试数等信息。此外,数据集还包括了与疫情相关的经济、社会和政策数据。

covid19datahub.io 收录

CBIS-DDSM

该数据集用于训练乳腺癌分类器或分割模型,包含3103张乳腺X光片,其中465张有多个异常。数据集分为训练集和测试集,还包括3568张裁剪的乳腺X光片和对应的掩码。

github 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录

微博与抖音评论数据集

数据集源自微博平台与抖音平台的评论信息,基于两个热点事件来对评论等信息进行爬取收集形成数据集。原数据一共3W5条,但消极评论与中立评论远远大于积极评论。因此作特殊处理后,积极数据2601条,消极数据2367条,中立数据2725条,共7693条数据。

github 收录