sameeksha2705/vit-fire-detection

Name: sameeksha2705/vit-fire-detection
Creator: sameeksha2705
Published: 2024-01-28 18:20:51
License: 暂无描述

Hugging Face2024-01-28 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/sameeksha2705/vit-fire-detection

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: image dtype: image - name: label dtype: class_label: names: '0': Fire '1': Normal '2': Smoke splits: - name: train num_bytes: 155708396.35 num_examples: 7575 download_size: 891961525 dataset_size: 155708396.35 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息：特征列表： - 特征名称：图像（image），数据类型：图像 - 特征名称：标签（label），数据类型：类别标签（class_label），其类别映射如下： '0': 火灾（Fire） '1': 正常（Normal） '2': 烟雾（Smoke）数据集划分： - 划分名称：训练集（train），占用字节数：155708396.35，样本数量：7575 下载大小：891961525 数据集总大小：155708396.35 数据集配置： - 配置名称：默认配置（default），数据文件配置： - 对应划分：训练集（train），文件路径：data/train-*

提供机构：

sameeksha2705

原始信息汇总

数据集概述

数据集特征

图像：
- 名称：image
- 数据类型：image
标签：
- 名称：label
- 数据类型：
  - 类别标签：
    - 名称：
      - 0: Fire
      - 1: Normal
      - 2: Smoke

数据集分割

训练集：
- 名称：train
- 字节数：155708396.35
- 样本数：7575

数据集大小

下载大小：891961525
数据集大小：155708396.35

配置

默认配置：
- 配置名称：default
- 数据文件：
  - 分割：train
  - 路径：data/train-*

搜集汇总

数据集介绍

构建方式

在火灾检测领域，高质量标注数据是训练智能视觉模型的基石。sameeksha2705/vit-fire-detection数据集专为基于Vision Transformer（ViT）的火灾检测任务构建，其图像数据来源于多种真实场景，涵盖室内外火灾发生与日常环境的视觉样本。数据集经过严格的筛选与标注流程，将每张图像划分为三类标签：Fire（火灾）、Normal（正常）、Smoke（烟雾），确保类别间具有明确的视觉区分度。所有图像以标准化格式存储，并统一划分为训练集，共计7575个样本，数据总量约155.7MB，为模型学习火灾与烟雾的时空特征提供了均衡且丰富的素材。

特点

该数据集的核心特点在于其简洁而高效的二元与三元分类结构，专为视觉Transformer模型优化。标签体系覆盖火灾检测中最关键的三种状态——明火、烟雾与正常场景，避免了冗余类别带来的学习干扰。图像数据来源多样，包含不同光照、背景和视角下的真实样本，增强了模型在复杂环境中的泛化能力。数据集以单训练集划分呈现，便于快速加载与迭代实验，同时其规模适中，既避免了小数据集导致的过拟合风险，又无需过多计算资源即可完成训练，非常适合用于ViT等大型模型的迁移学习与微调研究。

使用方法

使用该数据集时，研究者可通过Hugging Face Datasets库直接加载，利用默认配置读取train-*分片中的图像与标签数据。具体而言，调用load_dataset('sameeksha2705/vit-fire-detection')即可获取包含image字段（PIL图像对象）和label字段（整数编码，对应Fire、Normal、Smoke）的训练集。加载后，可结合PyTorch或TensorFlow的DataLoader进行批处理，并应用图像增强技术（如随机翻转、颜色抖动）以提升模型鲁棒性。对于ViT模型，需将图像调整为固定尺寸（如224x224），并归一化至模型预训练时的像素分布，随后按标准监督学习流程进行微调或从头训练，最终实现对火灾与烟雾的实时检测与预警。

背景与挑战

背景概述

火灾检测是计算机视觉领域的一项关键任务，旨在通过图像识别技术及时预警火灾隐患，保护生命财产安全。sameeksha2705/vit-fire-detection数据集由研究者Sameeksha于近期创建，基于Vision Transformer（ViT）架构设计，专注于火灾、烟雾及正常场景的分类。该数据集包含7575张训练图像，分为Fire、Normal和Smoke三个类别，为火灾检测研究提供了标准化的训练资源。其核心研究问题在于探索Transformer模型在细粒度火灾场景识别中的有效性，填补了传统CNN方法在全局特征捕捉上的不足。自发布以来，该数据集因其类别均衡性和实际应用价值，成为火灾预警系统研究的重要基准，推动了智能安防领域的技术进步。

当前挑战

该数据集所解决的领域问题在于提升火灾检测的准确性与鲁棒性，传统方法易受光照、遮挡等干扰，而ViT模型需应对小样本类别（如Smoke）的识别挑战。构建过程中，数据收集面临场景多样性不足的难题，实拍火灾图像获取困难，需依赖合成数据与公开资源，可能导致分布偏移。此外，类别标注需精确区分Fire与Smoke的视觉特征，避免模糊边界引发的误判。数据规模（7575张）相对有限，可能影响模型泛化能力，尤其在复杂环境下的实时检测中，高计算开销与低延迟需求间的矛盾进一步加剧了实际部署的挑战。

常用场景

经典使用场景

在计算机视觉与公共安全交叉领域，火灾的早期检测是防灾减灾的关键环节。sameeksha2705/vit-fire-detection数据集专为基于Vision Transformer（ViT）的火灾识别任务而设计，其经典使用场景在于训练和评估能够区分火焰、烟雾与正常环境的高精度分类模型。该数据集包含7575张标注图像，覆盖火、烟、正常三类场景，为ViT架构的预训练与微调提供了规模适中的基准数据，尤其适合验证注意力机制在火灾视觉特征提取中的有效性。

实际应用

在实际部署层面，此数据集训练的模型可无缝嵌入智能监控系统、无人机巡检平台及工业消防预警网络。例如，在森林防火中，ViT模型可实时分析红外或可见光摄像头回传画面，在火焰尚未蔓延时即发出警报；在城市高层建筑中，系统能区分厨房油烟与真实火灾烟雾，大幅降低误报率。这种数据驱动的智能预警方案正逐步取代传统单阈值传感器，成为智慧城市安全基础设施的核心组件。

衍生相关工作

围绕该数据集，学术界已催生出一系列衍生工作：研究者基于此数据微调了轻量级ViT变体（如Swin-Tiny、MobileViT），探索模型剪枝与知识蒸馏在边缘设备上的部署可行性；另有工作将其与公开火灾检测基准（如Corsican Fire Database）进行跨域泛化测试，提出对抗性域适应策略以增强模型在未知场景下的鲁棒性。这些研究不仅丰富了ViT在灾害视觉中的应用理论，也为构建通用火灾感知大模型积累了宝贵经验。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集