DetectiumFire
收藏DetectiumFire 数据集概述
数据集简介
DetectiumFire 是一个大规模多模态数据集,旨在推进传统计算机视觉和现代视觉语言任务中的火灾理解。该数据集提供高质量的真实和合成火灾数据、详细标注以及人类偏好反馈,用于训练和评估目标检测器、扩散模型和视觉语言模型。
数据访问
- 数据集下载地址:https://www.kaggle.com/datasets/38b79c344bdfc55d1eed3d22fbaa9c31fad45e27edbbe9e3c529d6e5c4f93890
- 关联模型地址:https://www.kaggle.com/models/yimengfuyao/detectiumfire-models
- 论文地址:https://openreview.net/forum?id=vhHYTjMt9Z
- 项目主页:https://detectium.io
数据集结构
图像数据
- 图像标注生成代码:
image_caption_gemini.py - 火灾提示词文件:
fire_prompts.json
元数据字段说明
- image:火灾图像文件名,位于 real_fire/images/ 目录
- source:图像来源,包括 web_search、iot_device_detectium、FIRE、Forest Fire 和 FireNET
- fire_prompt:经过最终编辑和人工验证的火灾提示词,用于文生图生成和扩散模型微调
- fire_type:详细的火灾类型分类标签,遵循层次分类体系
视频数据
- 视频标注生成代码:
caption_video_gemini.py - 视频切割代码:
cut_to_10s.py(将原始视频切割为10秒片段) - 数据集划分代码:
generate_train_val_test_split.py(生成训练/验证/测试集)
模型训练支持
TimeSformer 训练
- 官方实现:https://github.com/facebookresearch/TimeSformer
- 训练命令包含配置文件和参数设置
- 常见问题解决方案:处理导入错误
VideoMamba 训练
- 官方实现:https://github.com/OpenGVLab/VideoMamba
- 训练脚本配置说明
- 常见问题解决方案:处理参数错误
未来发展
计划迭代更新数据集并推出 DetectiumFire-Plus 版本,包含更多近期火灾相关图像。
引用信息
Liu, Z., Khajavi, S. H., & Jiang, G. (2025).
DetectiumFire: A Comprehensive Multi-modal Dataset Bridging Vision and Language for Fire Understanding.
NeurIPS Datasets and Benchmarks Track, 2025.
bibtex @inproceedings{liu2025detectiumfire, title = {DetectiumFire: A Comprehensive Multi-modal Dataset Bridging Vision and Language for Fire Understanding}, author = {Zixuan Liu and Siavash H. Khajavi and Guangkai Jiang}, booktitle = {The Thirty-ninth Annual Conference on Neural Information Processing Systems Datasets and Benchmarks Track}, year = {2025}, url = {https://openreview.net/forum?id=vhHYTjMt9Z} }




