five

InFAR

收藏
arXiv2025-09-30 收录
下载链接:
https://sites.google.com/site/yangliuxdu/
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为InFAR,包含了600段由红外热成像相机拍摄的视频序列,涵盖了多种动作类别,每个类别包含50个视频片段。每个动作类别的视频片段平均时长为4秒,帧率为25帧/秒。总的来说,这个数据集的规模达到了600个视频序列,其任务是对可见光至红外光范围内的动作进行识别。

This dataset is named InFAR. It contains 600 video sequences captured by infrared thermal imaging cameras, covering multiple action categories, with 50 video clips per category. The average duration of video clips for each action category is 4 seconds, and the frame rate is 25 frames per second. Overall, the scale of this dataset reaches 600 video sequences, and its task is action recognition within the visible-to-infrared spectral range.
搜集汇总
数据集介绍
main_image_url
构建方式
在红外动作识别领域,数据稀缺性长期制约着模型性能的提升。为此,InFAR数据集的构建采用了跨模态迁移学习的思路,旨在利用丰富的可见光动作数据辅助红外动作识别。具体而言,研究团队首先构建了一个全新的可见光动作数据集XD145,其包含12类动作,与目标红外数据集InFAR的类别完全对应。InFAR本身包含600段红外热成像视频,同样涵盖12类动作,每类50段。两个数据集均通过专业摄像机采集,并考虑了背景、姿态和视角的多样性,以确保数据的代表性和现实应用价值。这种成对构建可见光-红外数据集的方式,为后续的跨域特征对齐与泛化研究奠定了坚实基础。
使用方法
使用InFAR数据集进行研究的典型范式遵循跨域特征学习框架。首先,分别从InFAR(红外目标域)和XD145(可见光源域)数据中提取改进的密集轨迹特征,并经过局部约束线性编码和主成分分析进行预处理。核心步骤是应用论文提出的跨数据集特征对齐与泛化框架:利用核流形对齐方法将两个模态的数据映射到一个公共潜在空间,以减少模态差异;继而,通过一对对齐-泛化编码器,在同类动作中心点的引导下,进一步学习具有低类内差异和高类间方差的泛化特征表示。最终,基于对齐并泛化后的混合特征训练支持向量机分类器,并用于对未见过的红外测试样本进行分类。该方法有效验证了利用可见光知识提升红外动作识别性能的可行性。
背景与挑战
背景概述
在计算机视觉领域,红外人体动作识别因其对光照变化和阴影的鲁棒性而备受关注,然而相关数据资源长期匮乏。为应对这一挑战,西安电子科技大学与西北工业大学的研究团队于2018年联合构建了InFAR数据集,旨在为红外动作识别研究提供首个公开可用的基准数据。该数据集聚焦于跨模态动作识别这一核心问题,通过采集12类日常交互动作的红外视频,有效推动了可见光至红外域的知识迁移研究,为夜间监控、人机交互等实际应用奠定了数据基础。
当前挑战
InFAR数据集主要面临两大挑战:在领域问题层面,其需解决可见光与红外模态间的巨大特征差异,即如何克服传感器差异导致的数据分布不匹配问题,实现跨模态动作的准确识别;在构建过程层面,数据采集受限于红外成像设备的成本与环境敏感性,导致样本规模有限且类别平衡难以保障。此外,红外视频中动作的纹理细节缺失与热噪声干扰,进一步增加了数据标注与特征提取的复杂度,对模型泛化能力提出了更高要求。
常用场景
经典使用场景
在计算机视觉领域,红外人体动作识别因其对光照变化和阴影的鲁棒性而备受关注。InFAR数据集作为首个公开可用的红外动作识别数据集,其经典使用场景在于为跨模态动作识别研究提供基准测试平台。该数据集包含12类常见动作,如搏斗、握手、拥抱等,通过红外热成像捕捉,有效克服了可见光条件下因光照变化、背景杂乱和遮挡带来的识别挑战。研究者常利用InFAR评估各类特征提取方法和识别算法在红外模态下的性能,尤其在低光照或夜间监控等实际环境中,该数据集为算法验证提供了不可或缺的真实红外视频样本。
解决学术问题
InFAR数据集主要解决了红外动作识别领域数据稀缺的核心学术问题。在它出现之前,该领域缺乏公开可用的基准数据集,严重制约了算法比较与性能提升。该数据集使得系统评估和改进红外动作识别流程成为可能,包括对改进密集轨迹特征等低层描述符以及深度卷积神经网络方法的验证。更重要的是,它促进了跨数据集迁移学习研究,特别是可见光到红外模态的知识迁移问题。通过构建与可见光数据集XD145的对应类别,InFAR为研究如何利用丰富的可见光数据来辅助稀缺的红外数据识别提供了关键实验基础,推动了模态差距减小和特征对齐等前沿方向的发展。
实际应用
InFAR数据集的实际应用场景紧密关联于对光照条件不敏感的监控与交互系统。在安防监控领域,基于该数据集开发的算法可部署于夜间或低光照环境,实现全天候的人体异常行为检测,如夜间入侵识别或危险动作预警。在智能人机交互方面,它支持开发不受环境光照影响的体感控制系统,适用于昏暗环境下的游戏控制或虚拟现实交互。此外,在军事和安全应用中,红外动作识别技术可辅助夜间侦察与人员活动分析。该数据集通过提供真实的红外动作样本,直接助力于这些实际系统的算法训练与性能优化,提升了技术在复杂环境下的实用性与可靠性。
数据集最近研究
最新研究方向
在红外动作识别领域,InFAR数据集作为首个公开可用的红外动作数据集,为跨模态动作识别研究提供了关键基准。当前研究前沿聚焦于可见光至红外模态的迁移学习,旨在解决红外数据稀缺带来的性能瓶颈。通过构建跨数据集特征对齐与泛化框架,研究者将可见光动作数据作为辅助源域,利用核流形对齐技术将异构模态映射至共同特征空间,并结合对齐至泛化编码器模型生成具有低类内差异和高类间方差的通用特征表示。这一方向不仅推动了红外动作识别在夜视监控、人机交互等弱光场景下的实际应用,也为多模态融合与跨域自适应学习提供了新的方法论启示,显著提升了模型在复杂环境下的鲁棒性与泛化能力。
相关研究论文
  • 1
    Transferable Feature Representation for Visible-to-Infrared Cross-Dataset Human Action Recognition西安电子科技大学电信工程学院 · 2019年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作