互联网源视频数据集

Name: 互联网源视频数据集
Creator: 孟加拉国达卡 Daffodil 国际大学软件工程系
Published: 2025-04-23 12:17:41
License: 暂无描述

arXiv2025-04-23 更新2025-04-25 收录

下载链接：

http://arxiv.org/abs/2504.16404v1

下载链接

链接失效反馈

官方服务：

资源简介：

本研究构建的互联网源视频数据集包含50个视频，来源于40头牛，记录了室内外环境下的不同角度。数据集分为两半，一半是正常行走的牛，另一半是表现出异常步态的牛。为增强模型的泛化能力，对训练数据进行了数据增强处理。该数据集用于训练深度学习模型，以自动检测牛的跛行、疾病或步态异常。

The internet-sourced video dataset constructed in this study contains 50 videos from 40 cattle, recording footage from various angles in both indoor and outdoor environments. The dataset is divided into two halves: one half consists of cattle walking normally, while the other half shows cattle with abnormal gaits. To enhance the model's generalization ability, data augmentation was performed on the training data. This dataset is used for training deep learning models to automatically detect cattle lameness, diseases or gait abnormalities.

提供机构：

孟加拉国达卡 Daffodil 国际大学软件工程系

创建时间：

2025-04-23

搜集汇总

数据集介绍

构建方式

互联网源视频数据集的构建采用了创新的数据采集策略，通过YouTube平台获取了50段公开的牛只行走视频，涵盖40头不同个体。数据采集注重多样性，视频拍摄于室内外多种环境，并包含不同角度（正面、侧面、背面）及行走方向。数据集通过等量划分（25段正常步态与25段异常步态视频）确保类别平衡，每段视频平均时长为5秒。预处理阶段采用30fps帧率提取图像，随机选取1500帧并统一裁剪至608×608像素，随后通过水平翻转增强至3000帧训练数据，有效提升了模型的泛化能力。

特点

该数据集的核心价值在于其生态效度与多维特征。相较于传统局限于单一养殖场的视频数据，本数据集整合了半集约化养殖模式下室内外不同光照、地面材质的真实场景，覆盖了10种牛只行为模式。数据的时间维度特性（连续帧序列）为时空特征建模提供了基础，而50:50的病理/健康样本比例避免了类别偏差。特别值得注意的是，所有视频均经过兽医专家依据标题和描述进行双重标注，确保了标签的可靠性，为后续的3D CNN和ConvLSTM2D模型提供了优质的训练基底。

使用方法

该数据集的使用需遵循分层处理流程。研究者首先需使用OpenCV或MoviePy库提取视频帧，建议采用30fps标准采样率并统一图像尺寸。数据增强推荐限制于水平翻转以避免过度失真。模型构建阶段，3D CNN架构适合直接处理帧序列以捕捉时空特征，而ConvLSTM2D则更擅长建模长期运动依赖。评估时建议采用视频级多数表决机制，即当单视频中超过50%的帧被正确分类时判定整体结果。实验表明，在20%测试集比例下，3D CNN模型能达到90%的准确率，但需注意在线视频存在的标注噪声可能影响模型性能上限。

背景与挑战

背景概述

互联网源视频数据集由Md Fahimuzzman Sohan等研究人员于2025年创建，旨在通过深度学习技术自动检测牛群跛行问题。该数据集包含50个独特视频，涵盖40头不同牛只的室内外多角度行走影像，其中半数视频呈现正常步态，另一半展示异常步态。作为首个利用公开网络视频资源构建的牛只健康监测数据集，其创新性地突破了传统农场监控视频的采集局限，为计算机视觉在畜牧业的应用提供了新的数据范式。该研究通过3D CNN模型实现了90%的分类准确率，验证了网络视频在动物健康监测领域的应用潜力，对推动智慧农业发展具有重要意义。

当前挑战

该数据集面临的核心挑战体现在两个维度：在领域问题层面，牛只跛行检测需克服复杂背景下运动特征提取的困难，包括光照变化、遮挡干扰以及个体步态差异等影响因素；在构建过程中，研究者需解决网络视频质量参差不齐、标注依赖视频标题描述的可靠性问题，以及有限样本量导致的模型泛化性约束。特别值得注意的是，数据集中牛只异常状态的医学验证缺失，可能影响模型的临床适用性。此外，直接分类方法虽简化了流程，但相较传统多阶段检测方法可能丢失细粒度特征信息，这为后续研究提出了算法优化方向。

常用场景

经典使用场景

互联网源视频数据集在畜牧业智能化管理中扮演着关键角色，尤其在牛群跛行自动检测领域展现出显著价值。该数据集通过采集不同环境下牛只行走视频，为深度学习模型提供了丰富的时空特征学习素材。研究者利用3D CNN和ConvLSTM2D等先进架构，直接从视频序列中提取步态特征，避免了传统方法中复杂的多阶段处理流程，实现了端到端的跛行分类。这种基于视频分析的解决方案，为大规模养殖场的动物健康监测提供了高效的技术路径。

衍生相关工作

该数据集催生了多个具有影响力的衍生研究：Qiao等人开发的C3D-ConvLSTM混合模型将准确率提升至90.32%；Russello团队结合姿态估计与多 locomotion traits 分析构建了更精细的跛行评分系统；Barney提出的改进版Mask-RCNN实现了实时多牛只跟踪检测。这些工作共同推动了计算机视觉在精准畜牧业中的应用深度，形成从二维图像处理到三维视频分析，从单特征识别到多模态融合的技术演进路线，为行业智能化转型奠定了坚实基础。

数据集最近研究