five

jjldo21/IndustrialDetectionStaticCameras

收藏
Hugging Face2024-02-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jjldo21/IndustrialDetectionStaticCameras
下载链接
链接失效反馈
官方服务:
资源简介:
IndustrialDetectionStaticCameras数据集分为五个主要文件,分别命名为video1到video5。每个文件包含一个场景的视频(.mp4格式)、视频帧的图像文件夹(imgs_videoY)以及每个帧的标注文件夹(annotations_videoY)。标注文件采用KITTI格式,每行表示一个对象的标注信息,包括对象类型、截断、遮挡、角度、边界框位置、高度、宽度、长度、三维坐标和旋转角度等字段。该数据集主要用于工业场景中的对象检测任务。

IndustrialDetectionStaticCameras数据集分为五个主要文件,分别命名为video1到video5。每个文件包含一个场景的视频(.mp4格式)、视频帧的图像文件夹(imgs_videoY)以及每个帧的标注文件夹(annotations_videoY)。标注文件采用KITTI格式,每行表示一个对象的标注信息,包括对象类型、截断、遮挡、角度、边界框位置、高度、宽度、长度、三维坐标和旋转角度等字段。该数据集主要用于工业场景中的对象检测任务。
提供机构:
jjldo21
原始信息汇总

数据集概述

许可证

  • MIT

数据集大小

  • 1K < n < 10K

任务类别

  • 目标检测

标签

  • 行业

数据集信息

特征

  • image: 图像
  • labels: 标签序列
    • object_type: 对象类型 (string)
    • truncation: 截断 (float32)
    • occlusion: 遮挡 (int32)
    • alpha: 角度 (int32)
    • left: 左边界 (float32)
    • top: 上边界 (float32)
    • right: 右边界 (float32)
    • bottom: 下边界 (float32)
    • height: 高度 (int32)
    • width: 宽度 (int32)
    • length: 长度 (int32)
    • x: x坐标 (int32)
    • y: y坐标 (int32)
    • z: z坐标 (int32)
    • rotation_y: y轴旋转 (int32)

分割

  • video1: 4497677.132999999 字节, 1261 个样本
  • video2: 4116557.136 字节, 1221 个样本
  • video3: 4034190.129 字节, 1221 个样本
  • video4: 5164007.345000001 字节, 1481 个样本
  • video5: 4733783.518 字节, 1301 个样本

下载和数据集大小

  • 下载大小: 19236723 字节
  • 数据集大小: 22546215.261 字节

配置

  • default
    • video1: data/video1-*
    • video2: data/video2-*
    • video3: data/video3-*
    • video4: data/video4-*
    • video5: data/video5-*
搜集汇总
数据集介绍
main_image_url
构建方式
在工业视觉检测领域,数据集的构建需兼顾真实场景的复杂性与标注的精确性。IndustrialDetectionStaticCameras数据集通过部署静态摄像头,采集了五个独立工业场景的视频序列,并逐帧提取图像。每帧图像均采用KITTI格式进行标注,标注信息涵盖物体类型、边界框坐标及静态属性标识,确保了数据在空间与时间维度上的连贯性。
特点
该数据集的核心特征在于其专注于工业环境下的物体检测,并引入了静态物体标识这一独特维度。数据规模适中,包含超过六千张图像,标注信息不仅提供常规的边界框与类别,还通过旋转角度字段区分物体的静态属性,为研究场景理解与动态分析提供了细粒度标签。数据以视频序列形式组织,保留了时间连续性,适用于时序分析与少样本学习任务。
使用方法
使用者可通过Hugging Face的datasets库便捷加载该数据集。安装相应软件包后,调用load_dataset函数并指定数据集名称即可获取结构化数据。数据已预分为五个视频序列,可直接用于模型训练与评估。标注文件中的关键字段如物体类型、边界框及静态标识可供灵活解析,支持目标检测、静态物体识别乃至基于光流的时序分析等多种下游任务。
背景与挑战
背景概述
工业场景下的目标检测是计算机视觉领域的关键研究方向,尤其在智能制造与安全生产中具有重要应用价值。IndustrialDetectionStaticCameras数据集由研究人员jjldo21于近期构建,旨在支持其论文《一种基于通用自监督视觉特征与稠密光流的少样本学习方法以提升工业场景安全性》中提出的方法论验证。该数据集聚焦于静态摄像头捕获的工业环境视频数据,核心研究问题在于如何利用少样本学习技术,在有限标注条件下实现对工业场景中物体的精准检测与状态识别,从而为工业自动化与安全监控系统提供可靠的数据基础。其构建不仅丰富了工业视觉数据资源,也为少样本学习在复杂实际场景中的应用探索提供了实证支撑。
当前挑战
该数据集致力于解决工业环境中目标检测的特定挑战,包括在光照变化、遮挡频繁及背景复杂的条件下,实现对静态与动态物体的稳定识别与分类。构建过程中,数据采集面临工业场景多样性不足与标注一致性难以保证的困难,需在真实生产线环境中部署静态摄像头,并处理视频帧间物体的运动模糊与姿态变化。此外,标注遵循KITTI格式但仅部分字段有效,这要求标注人员精确区分物体的静态属性,增加了标注过程的复杂度与时间成本。
常用场景
经典使用场景
在工业视觉检测领域,静态摄像机捕捉的场景往往包含复杂的背景与动态目标,这为物体识别带来了挑战。该数据集通过提供多段工业场景视频及其逐帧标注,为研究者构建和评估少样本学习模型提供了标准化的实验平台。其标注格式兼容KITTI标准,便于直接应用于主流目标检测框架,如YOLO或Faster R-CNN,从而在有限标注数据下优化模型对工业环境中静态与动态物体的区分能力。
解决学术问题
该数据集旨在解决工业安全监控中少样本学习的关键难题,即如何在标注数据稀缺的情况下,提升模型对异常物体或危险行为的识别精度。通过提供密集光流与自监督视觉特征相结合的标注信息,它支持学术界探索迁移学习与领域自适应方法,有效缓解工业场景数据分布不均、类别不平衡等问题,推动了视觉特征泛化能力的研究进展。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作,主要集中在少样本学习与自监督视觉表征领域。例如,原论文提出的基于通用自监督特征与密集光流的方法,为工业场景目标检测设立了新基准。后续研究进一步拓展了多模态融合、时序分析等技术,推动了工业异常检测模型的轻量化与实时化发展,并在相关学术会议如CVPR或ICCV中形成了系列成果。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作