sameeksha2705/vit-fire-detection
收藏Hugging Face2024-01-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/sameeksha2705/vit-fire-detection
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: image
dtype: image
- name: label
dtype:
class_label:
names:
'0': Fire
'1': Normal
'2': Smoke
splits:
- name: train
num_bytes: 155708396.35
num_examples: 7575
download_size: 891961525
dataset_size: 155708396.35
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征列表:
- 特征名称:图像(image),数据类型:图像
- 特征名称:标签(label),数据类型:类别标签(class_label),其类别映射如下:
'0': 火灾(Fire)
'1': 正常(Normal)
'2': 烟雾(Smoke)
数据集划分:
- 划分名称:训练集(train),占用字节数:155708396.35,样本数量:7575
下载大小:891961525
数据集总大小:155708396.35
数据集配置:
- 配置名称:默认配置(default),数据文件配置:
- 对应划分:训练集(train),文件路径:data/train-*
提供机构:
sameeksha2705
原始信息汇总
数据集概述
数据集特征
- 图像:
- 名称:image
- 数据类型:image
- 标签:
- 名称:label
- 数据类型:
- 类别标签:
- 名称:
- 0: Fire
- 1: Normal
- 2: Smoke
- 名称:
- 类别标签:
数据集分割
- 训练集:
- 名称:train
- 字节数:155708396.35
- 样本数:7575
数据集大小
- 下载大小:891961525
- 数据集大小:155708396.35
配置
- 默认配置:
- 配置名称:default
- 数据文件:
- 分割:train
- 路径:data/train-*
搜集汇总
数据集介绍

构建方式
在火灾检测领域,高质量标注数据是训练智能视觉模型的基石。sameeksha2705/vit-fire-detection数据集专为基于Vision Transformer(ViT)的火灾检测任务构建,其图像数据来源于多种真实场景,涵盖室内外火灾发生与日常环境的视觉样本。数据集经过严格的筛选与标注流程,将每张图像划分为三类标签:Fire(火灾)、Normal(正常)、Smoke(烟雾),确保类别间具有明确的视觉区分度。所有图像以标准化格式存储,并统一划分为训练集,共计7575个样本,数据总量约155.7MB,为模型学习火灾与烟雾的时空特征提供了均衡且丰富的素材。
特点
该数据集的核心特点在于其简洁而高效的二元与三元分类结构,专为视觉Transformer模型优化。标签体系覆盖火灾检测中最关键的三种状态——明火、烟雾与正常场景,避免了冗余类别带来的学习干扰。图像数据来源多样,包含不同光照、背景和视角下的真实样本,增强了模型在复杂环境中的泛化能力。数据集以单训练集划分呈现,便于快速加载与迭代实验,同时其规模适中,既避免了小数据集导致的过拟合风险,又无需过多计算资源即可完成训练,非常适合用于ViT等大型模型的迁移学习与微调研究。
使用方法
使用该数据集时,研究者可通过Hugging Face Datasets库直接加载,利用默认配置读取train-*分片中的图像与标签数据。具体而言,调用load_dataset('sameeksha2705/vit-fire-detection')即可获取包含image字段(PIL图像对象)和label字段(整数编码,对应Fire、Normal、Smoke)的训练集。加载后,可结合PyTorch或TensorFlow的DataLoader进行批处理,并应用图像增强技术(如随机翻转、颜色抖动)以提升模型鲁棒性。对于ViT模型,需将图像调整为固定尺寸(如224x224),并归一化至模型预训练时的像素分布,随后按标准监督学习流程进行微调或从头训练,最终实现对火灾与烟雾的实时检测与预警。
背景与挑战
背景概述
火灾检测是计算机视觉领域的一项关键任务,旨在通过图像识别技术及时预警火灾隐患,保护生命财产安全。sameeksha2705/vit-fire-detection数据集由研究者Sameeksha于近期创建,基于Vision Transformer(ViT)架构设计,专注于火灾、烟雾及正常场景的分类。该数据集包含7575张训练图像,分为Fire、Normal和Smoke三个类别,为火灾检测研究提供了标准化的训练资源。其核心研究问题在于探索Transformer模型在细粒度火灾场景识别中的有效性,填补了传统CNN方法在全局特征捕捉上的不足。自发布以来,该数据集因其类别均衡性和实际应用价值,成为火灾预警系统研究的重要基准,推动了智能安防领域的技术进步。
当前挑战
该数据集所解决的领域问题在于提升火灾检测的准确性与鲁棒性,传统方法易受光照、遮挡等干扰,而ViT模型需应对小样本类别(如Smoke)的识别挑战。构建过程中,数据收集面临场景多样性不足的难题,实拍火灾图像获取困难,需依赖合成数据与公开资源,可能导致分布偏移。此外,类别标注需精确区分Fire与Smoke的视觉特征,避免模糊边界引发的误判。数据规模(7575张)相对有限,可能影响模型泛化能力,尤其在复杂环境下的实时检测中,高计算开销与低延迟需求间的矛盾进一步加剧了实际部署的挑战。
常用场景
经典使用场景
在计算机视觉与公共安全交叉领域,火灾的早期检测是防灾减灾的关键环节。sameeksha2705/vit-fire-detection数据集专为基于Vision Transformer(ViT)的火灾识别任务而设计,其经典使用场景在于训练和评估能够区分火焰、烟雾与正常环境的高精度分类模型。该数据集包含7575张标注图像,覆盖火、烟、正常三类场景,为ViT架构的预训练与微调提供了规模适中的基准数据,尤其适合验证注意力机制在火灾视觉特征提取中的有效性。
实际应用
在实际部署层面,此数据集训练的模型可无缝嵌入智能监控系统、无人机巡检平台及工业消防预警网络。例如,在森林防火中,ViT模型可实时分析红外或可见光摄像头回传画面,在火焰尚未蔓延时即发出警报;在城市高层建筑中,系统能区分厨房油烟与真实火灾烟雾,大幅降低误报率。这种数据驱动的智能预警方案正逐步取代传统单阈值传感器,成为智慧城市安全基础设施的核心组件。
衍生相关工作
围绕该数据集,学术界已催生出一系列衍生工作:研究者基于此数据微调了轻量级ViT变体(如Swin-Tiny、MobileViT),探索模型剪枝与知识蒸馏在边缘设备上的部署可行性;另有工作将其与公开火灾检测基准(如Corsican Fire Database)进行跨域泛化测试,提出对抗性域适应策略以增强模型在未知场景下的鲁棒性。这些研究不仅丰富了ViT在灾害视觉中的应用理论,也为构建通用火灾感知大模型积累了宝贵经验。
以上内容由遇见数据集搜集并总结生成



