five

Fire Detection, Oil Spill Detection, Human Activity Recognition, Acoustic Impedance Estimation

收藏
arXiv2025-01-11 更新2025-01-14 收录
下载链接:
https://github.com/hpcclab
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由北德克萨斯大学高性能云计算实验室创建,主要用于评估异构云计算平台上不同应用类型的性能。数据集包括火灾检测、油污检测、人类活动识别和声阻抗估计四个部分,涵盖了240个视频、110张SAR图像、UCI机器学习库中的智能手机活动数据以及Marmousi 2地震数据集。数据集的创建过程涉及在AWS和Chameleon Cloud平台上运行多个基准测试,以捕捉不同机器类型下的推理时间。该数据集旨在帮助研究人员优化云计算资源分配,提升成本效益和可扩展性,特别是在工业4.0、辅助技术和多媒体处理等领域。

This dataset was created by the High-Performance Cloud Computing Lab at the University of North Texas, and is primarily designed to evaluate the performance of various application types on heterogeneous cloud computing platforms. It comprises four modules: fire detection, oil spill detection, human activity recognition, and acoustic impedance estimation, covering 240 video clips, 110 SAR images, smartphone activity data from the UCI Machine Learning Repository, and the Marmousi 2 seismic dataset. The dataset development process involved executing multiple benchmark tests on AWS and Chameleon Cloud platforms to capture inference latency across different machine types. This dataset is intended to help researchers optimize cloud computing resource allocation, enhance cost-effectiveness and scalability, especially in domains such as Industry 4.0, assistive technology, and multimedia processing.
提供机构:
北德克萨斯大学高性能云计算实验室
创建时间:
2025-01-11
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建基于多个应用领域的深度神经网络(DNN)和机器学习(ML)推理任务,涵盖了火灾检测、油污检测、人类活动识别和声阻抗估计等工业应用场景。数据集通过在不同云平台(如AWS和Chameleon Cloud)上部署异构计算资源,收集了各类应用的推理时间数据。具体而言,火灾检测使用了FireNet模型,油污检测基于FCN-8模型,人类活动识别采用了序列神经网络模型,而声阻抗估计则依赖于时间卷积网络。每个应用的数据均通过多次实验获取,以确保结果的可靠性和统计显著性。
特点
该数据集的特点在于其广泛的应用覆盖范围和高度的异构性。数据集不仅涵盖了工业领域的实时检测任务,还涉及了辅助技术中的图像分类、语音识别等任务。数据集中的每个应用都经过了严格的性能评估,特别是在不同云平台和异构计算资源上的推理时间表现。此外,数据集还提供了详细的统计分析和执行时间的分布情况,帮助研究人员深入理解异构计算环境下的性能差异。
使用方法
该数据集的使用方法主要包括通过GitHub仓库获取数据集和相关的基准测试脚本。研究人员可以根据需要下载特定应用的推理时间数据,并使用提供的脚本在不同的云平台上复现实验结果。数据集的使用场景包括但不限于工业安全监控、辅助技术开发以及多媒体处理。通过分析数据集中的推理时间,研究人员可以优化资源分配策略,提升应用的执行效率和成本效益。
背景与挑战
背景概述
Fire Detection, Oil Spill Detection, Human Activity Recognition, Acoustic Impedance Estimation 数据集由北德克萨斯大学高性能云计算实验室(HPCC Lab)的研究团队于2025年创建,旨在通过异构云计算服务对工业应用中的深度学习推理任务进行基准测试。该数据集涵盖了石油与天然气行业中的火灾检测、油污检测、人类活动识别以及声阻抗估计等关键应用场景。这些应用场景对实时性和准确性要求极高,直接关系到工业安全和效率。通过在不同云平台上进行基准测试,该数据集为研究人员提供了宝贵的性能数据,帮助优化资源分配,提升计算效率。该数据集的研究成果对工业4.0和智能技术的发展具有重要推动作用。
当前挑战
该数据集在解决工业应用中的深度学习推理问题时,面临的主要挑战包括:1) 实时性要求与计算资源异构性之间的矛盾,不同云平台的硬件配置差异导致推理时间波动较大;2) 数据处理的复杂性,特别是在油污检测和声阻抗估计中,需要处理高分辨率的卫星图像和地震数据,这对计算资源和算法效率提出了极高要求。在数据集构建过程中,研究人员还需克服数据标注的准确性、模型训练的稳定性以及跨平台性能评估的一致性等挑战。这些挑战不仅影响了数据集的构建效率,也对后续的应用部署和优化提出了更高的要求。
常用场景
经典使用场景
该数据集在工业应用、辅助技术和多媒体处理等领域中具有广泛的应用。特别是在石油和天然气行业中,数据集被用于火灾检测、油污检测和声阻抗估计等实时任务,确保在关键环境中能够快速准确地做出决策。此外,数据集还支持辅助技术中的图像分类、语音识别和视频转码等任务,帮助盲人和视障用户更好地与周围环境互动。
实际应用
在实际应用中,该数据集被广泛用于石油和天然气行业的火灾和油污检测系统,帮助预防灾难性事故的发生。同时,数据集还支持辅助技术中的语音识别和图像分类任务,提升盲人和视障用户的独立性和生活质量。此外,数据集在多媒体领域的视频转码任务中也发挥了重要作用,优化了视频流媒体的处理效率。
衍生相关工作
该数据集衍生了许多经典研究工作,例如基于FireNet模型的火灾检测系统、基于FCN-8模型的油污检测系统,以及基于YOLOv5模型的物体检测系统。此外,数据集还支持了多个机器学习模型的基准测试,如ResNet50、DistilBERT和Wav2vec2等,推动了深度学习在工业、辅助技术和多媒体处理领域的应用和发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作