five

sameeksha2705/vit-fire-detection

收藏
Hugging Face2024-01-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/sameeksha2705/vit-fire-detection
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: image dtype: image - name: label dtype: class_label: names: '0': Fire '1': Normal '2': Smoke splits: - name: train num_bytes: 155708396.35 num_examples: 7575 download_size: 891961525 dataset_size: 155708396.35 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息: 特征列表: - 特征名称:图像(image),数据类型:图像 - 特征名称:标签(label),数据类型:类别标签(class_label),其类别映射如下: '0': 火灾(Fire) '1': 正常(Normal) '2': 烟雾(Smoke) 数据集划分: - 划分名称:训练集(train),占用字节数:155708396.35,样本数量:7575 下载大小:891961525 数据集总大小:155708396.35 数据集配置: - 配置名称:默认配置(default),数据文件配置: - 对应划分:训练集(train),文件路径:data/train-*
提供机构:
sameeksha2705
原始信息汇总

数据集概述

数据集特征

  • 图像
    • 名称:image
    • 数据类型:image
  • 标签
    • 名称:label
    • 数据类型:
      • 类别标签:
        • 名称:
          • 0: Fire
          • 1: Normal
          • 2: Smoke

数据集分割

  • 训练集
    • 名称:train
    • 字节数:155708396.35
    • 样本数:7575

数据集大小

  • 下载大小:891961525
  • 数据集大小:155708396.35

配置

  • 默认配置
    • 配置名称:default
    • 数据文件:
      • 分割:train
      • 路径:data/train-*
搜集汇总
数据集介绍
main_image_url
构建方式
在火灾检测领域,高质量标注数据是训练智能视觉模型的基石。sameeksha2705/vit-fire-detection数据集专为基于Vision Transformer(ViT)的火灾检测任务构建,其图像数据来源于多种真实场景,涵盖室内外火灾发生与日常环境的视觉样本。数据集经过严格的筛选与标注流程,将每张图像划分为三类标签:Fire(火灾)、Normal(正常)、Smoke(烟雾),确保类别间具有明确的视觉区分度。所有图像以标准化格式存储,并统一划分为训练集,共计7575个样本,数据总量约155.7MB,为模型学习火灾与烟雾的时空特征提供了均衡且丰富的素材。
特点
该数据集的核心特点在于其简洁而高效的二元与三元分类结构,专为视觉Transformer模型优化。标签体系覆盖火灾检测中最关键的三种状态——明火、烟雾与正常场景,避免了冗余类别带来的学习干扰。图像数据来源多样,包含不同光照、背景和视角下的真实样本,增强了模型在复杂环境中的泛化能力。数据集以单训练集划分呈现,便于快速加载与迭代实验,同时其规模适中,既避免了小数据集导致的过拟合风险,又无需过多计算资源即可完成训练,非常适合用于ViT等大型模型的迁移学习与微调研究。
使用方法
使用该数据集时,研究者可通过Hugging Face Datasets库直接加载,利用默认配置读取train-*分片中的图像与标签数据。具体而言,调用load_dataset('sameeksha2705/vit-fire-detection')即可获取包含image字段(PIL图像对象)和label字段(整数编码,对应Fire、Normal、Smoke)的训练集。加载后,可结合PyTorch或TensorFlow的DataLoader进行批处理,并应用图像增强技术(如随机翻转、颜色抖动)以提升模型鲁棒性。对于ViT模型,需将图像调整为固定尺寸(如224x224),并归一化至模型预训练时的像素分布,随后按标准监督学习流程进行微调或从头训练,最终实现对火灾与烟雾的实时检测与预警。
背景与挑战
背景概述
火灾检测是计算机视觉领域的一项关键任务,旨在通过图像识别技术及时预警火灾隐患,保护生命财产安全。sameeksha2705/vit-fire-detection数据集由研究者Sameeksha于近期创建,基于Vision Transformer(ViT)架构设计,专注于火灾、烟雾及正常场景的分类。该数据集包含7575张训练图像,分为Fire、Normal和Smoke三个类别,为火灾检测研究提供了标准化的训练资源。其核心研究问题在于探索Transformer模型在细粒度火灾场景识别中的有效性,填补了传统CNN方法在全局特征捕捉上的不足。自发布以来,该数据集因其类别均衡性和实际应用价值,成为火灾预警系统研究的重要基准,推动了智能安防领域的技术进步。
当前挑战
该数据集所解决的领域问题在于提升火灾检测的准确性与鲁棒性,传统方法易受光照、遮挡等干扰,而ViT模型需应对小样本类别(如Smoke)的识别挑战。构建过程中,数据收集面临场景多样性不足的难题,实拍火灾图像获取困难,需依赖合成数据与公开资源,可能导致分布偏移。此外,类别标注需精确区分Fire与Smoke的视觉特征,避免模糊边界引发的误判。数据规模(7575张)相对有限,可能影响模型泛化能力,尤其在复杂环境下的实时检测中,高计算开销与低延迟需求间的矛盾进一步加剧了实际部署的挑战。
常用场景
经典使用场景
在计算机视觉与公共安全交叉领域,火灾的早期检测是防灾减灾的关键环节。sameeksha2705/vit-fire-detection数据集专为基于Vision Transformer(ViT)的火灾识别任务而设计,其经典使用场景在于训练和评估能够区分火焰、烟雾与正常环境的高精度分类模型。该数据集包含7575张标注图像,覆盖火、烟、正常三类场景,为ViT架构的预训练与微调提供了规模适中的基准数据,尤其适合验证注意力机制在火灾视觉特征提取中的有效性。
实际应用
在实际部署层面,此数据集训练的模型可无缝嵌入智能监控系统、无人机巡检平台及工业消防预警网络。例如,在森林防火中,ViT模型可实时分析红外或可见光摄像头回传画面,在火焰尚未蔓延时即发出警报;在城市高层建筑中,系统能区分厨房油烟与真实火灾烟雾,大幅降低误报率。这种数据驱动的智能预警方案正逐步取代传统单阈值传感器,成为智慧城市安全基础设施的核心组件。
衍生相关工作
围绕该数据集,学术界已催生出一系列衍生工作:研究者基于此数据微调了轻量级ViT变体(如Swin-Tiny、MobileViT),探索模型剪枝与知识蒸馏在边缘设备上的部署可行性;另有工作将其与公开火灾检测基准(如Corsican Fire Database)进行跨域泛化测试,提出对抗性域适应策略以增强模型在未知场景下的鲁棒性。这些研究不仅丰富了ViT在灾害视觉中的应用理论,也为构建通用火灾感知大模型积累了宝贵经验。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作