five

MOTChallenge Head Tracking 21 dataset (HT21)|人头检测数据集|无人机视频分析数据集

收藏
github2023-12-05 更新2024-05-31 收录
人头检测
无人机视频分析
下载链接:
https://github.com/kmohenski/YOLO_NAS_Head_Detection
下载链接
链接失效反馈
资源简介:
用于训练YOLO NAS模型以检测无人机视频中的人头,数据集未在YOLO格式中标注,通过转换脚本转换为YOLO格式。

This dataset is utilized for training the YOLO NAS model to detect human heads in drone footage. The dataset is not annotated in YOLO format; it is converted to YOLO format using a conversion script.
创建时间:
2023-12-05
原始信息汇总

数据集概述

数据集名称

  • YOLO NAS Head detection

数据集来源

  • MOTChallenge Head Tracking 21 dataset (HT21)
  • Drone footage from Kaggle

数据集处理

  • 初始数据集:HT21数据集原始标签格式不符合YOLO NAS要求,通过converter.py脚本转换为YOLO格式。数据按5:1的比例分为训练集和验证集。
  • 测试数据集:从视频中提取图像,手动在Roboflow中标注,并导出为YOLOv8格式。
  • 空数据:包含5%的无头数据,用于减少误报,通过frame_extractor.py从YouTube视频中随机提取。

数据增强与转换

  • 训练数据:使用YOLO NAS内置工具进行数据增强,包括Mosaic、RandomAffine、Mixup、HSV调整和水平翻转等。
  • 验证数据:使用PaddedRescale和TargetsFormatTransform进行数据转换。

训练参数

  • 输入尺寸:1920x1088
  • 训练配置:使用AdamW优化器,学习率采用余弦衰减策略,最大训练周期为30。
  • 损失函数:使用PPYoloELoss,结合多种检测指标进行模型评估。

模型评估

  • 训练日志:通过TensorBoard分析训练过程中的损失变化,辅助模型选择。
  • 测试结果:在不同配置下测试模型性能,评估其在实际视频中的检测效果。

未来改进

  • 数据集扩展:计划使用当前最佳模型自动标注更多数据集,增加数据多样性。
  • 模型优化:考虑使用更大的YOLO-NAS-L模型,并在云服务器上进行训练以加速进程。
AI搜集汇总
数据集介绍
main_image_url
构建方式
MOTChallenge Head Tracking 21数据集(HT21)的构建过程涉及多步骤的数据处理与转换。首先,原始数据集并未以YOLO格式标注,因此通过自定义的转换脚本将其标注转换为YOLO格式,并将数据按5:1的比例划分为训练集和验证集。其次,测试数据集通过从视频中提取帧图像,并手动标注生成。为了减少误检,还引入了5%的无头图像数据,这些数据通过从随机YouTube视频中提取帧图像生成。最后,利用YOLO NAS内置的数据增强工具对训练和验证数据进行变换,以提升模型的鲁棒性。
特点
HT21数据集的特点在于其专注于无人机拍摄场景下的人头检测任务,数据来源于真实场景,具有较高的多样性和复杂性。数据集包含丰富的图像和视频帧,涵盖了不同角度、光照条件和背景环境。此外,数据集中还特别引入了无头图像数据,以减少模型在检测过程中产生的误检。这些特点使得该数据集在训练和评估人头检测模型时具有较高的实用性和挑战性。
使用方法
使用HT21数据集进行模型训练时,首先需要将数据集转换为YOLO格式,并通过数据增强工具对训练数据进行预处理。训练过程中,输入图像的尺寸被调整为1920x1088,以适应模型的输入要求。由于硬件限制,训练数据被缩减为原始数据的十分之一,以缩短训练时间。训练参数包括学习率、优化器、损失函数等,均经过精心调优。训练完成后,可以通过TensorBoard可视化训练日志,评估模型性能。测试时,模型在视频帧上进行人头检测,检测结果以50%的概率阈值进行筛选,以减少误检。
背景与挑战
背景概述
MOTChallenge Head Tracking 21 dataset (HT21) 是一个专注于无人机视频中头部检测的数据集,旨在解决复杂场景下的人头跟踪问题。该数据集由MOTChallenge团队于2021年发布,主要用于推动计算机视觉领域中的目标检测与跟踪技术发展。HT21数据集的核心研究问题在于如何在动态、多变的无人机视角下,准确检测并跟踪人头目标,尤其是在低分辨率、遮挡和复杂背景等挑战性条件下。该数据集的出现为相关领域的研究提供了重要的基准数据,推动了基于深度学习的头部检测算法的进步。
当前挑战
HT21数据集在应用过程中面临多重挑战。首先,数据集本身并未直接提供YOLO格式的标注,研究人员需要通过额外的脚本进行格式转换,增加了数据预处理的复杂性。其次,由于无人机视频的分辨率较高,训练过程中需要处理大量高分辨率图像,这对计算资源提出了极高的要求,导致训练时间显著延长。此外,数据集中的目标尺寸较小,且存在遮挡和复杂背景干扰,这对模型的鲁棒性和泛化能力提出了更高的要求。为了减少误检,研究人员还需引入无头图像作为负样本,进一步增加了数据标注和处理的难度。
常用场景
经典使用场景
MOTChallenge Head Tracking 21数据集(HT21)在计算机视觉领域中被广泛应用于无人机视频中的人头检测任务。该数据集通过提供高分辨率的视频帧和精确的标注,使得研究人员能够训练和验证目标检测模型,尤其是在复杂背景和动态场景下的检测能力。经典的使用场景包括在人群密集的公共场所进行人头检测,以支持人群监控、行为分析等应用。
衍生相关工作
基于HT21数据集,许多经典的研究工作得以展开。例如,YOLO NAS模型的训练和优化工作,通过结合该数据集,显著提升了小目标检测的精度和效率。此外,该数据集还催生了多目标跟踪算法的改进,尤其是在复杂背景下的目标关联和轨迹预测方面。这些衍生工作进一步推动了计算机视觉领域的技术进步,并为实际应用提供了强有力的支持。
数据集最近研究
最新研究方向
近年来,MOTChallenge Head Tracking 21 (HT21) 数据集在无人机视频中的人头检测领域引起了广泛关注。该数据集的最新研究方向主要集中在利用YOLO NAS模型进行高效的人头检测,尤其是在复杂背景和动态场景下的性能优化。研究者通过数据增强、空数据引入以及模型训练参数的精细调整,显著提升了模型在低分辨率和小目标检测中的表现。此外,针对无人机视频中常见的视角变化和光照条件,研究还探索了多尺度输入和生成式扩散模型(如DALL-E)在数据生成中的应用,以进一步丰富训练数据的多样性。这些研究不仅推动了人头检测技术的进步,也为无人机监控、人群分析等实际应用提供了强有力的技术支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

OpenSonarDatasets

OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。

github 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录

Global Flood Database (GFD)

全球洪水数据库(GFD)是一个包含全球范围内洪水事件记录的数据集。该数据集提供了详细的洪水事件信息,包括洪水发生的时间、地点、影响范围、受灾人口和财产损失等。数据集的目的是为了支持洪水风险评估、灾害管理和气候变化研究。

global-flood-database.cloudtostreet.info 收录

The MaizeGDB

The MaizeGDB(Maize Genetics and Genomics Database)是一个专门为玉米(Zea mays)基因组学研究提供数据和工具的在线资源。该数据库包含了玉米的基因组序列、基因注释、遗传图谱、突变体信息、表达数据、以及与玉米相关的文献和研究工具。MaizeGDB旨在支持玉米遗传学和基因组学的研究,为科学家提供了一个集成的平台来访问和分析玉米的遗传和基因组数据。

www.maizegdb.org 收录

GFS

数据来源采自美国国家环境预报中心的GFS(全球预报系统),该系统每天发布4次全球范围的气象数据,分辨率最高可达到0.25° x 0.25°。GFS数据提供FTP下载方式:https://nomads.ncep.noaa.gov/pub/data/nccf/com/gfs/。每次发布的数据保存在命名为gfs.YYYYMMDDHH的文件夹中。本次需要的数据精度为0.25°(0p25),所以数据的文件名为:gfs.t{ HH }z.pgrb2.0p25.f{ XXX }

地球大数据科学工程 收录