five

THUMOS15|视频理解数据集|动作识别数据集

收藏
帕依提提2024-03-04 收录
视频理解
动作识别
下载链接:
https://www.payititi.com/opendatasets/show-196.html
下载链接
链接失效反馈
资源简介:
Automatically recognizing and localizing a large number of action categories from videos in the wild of significant importance for video understanding and multimedia event detection. THUMOS workshop and challenge aims at exploring new challenges and approaches for large-scale action recognition with large number of classes from open source videos in a realistic setting. Most of the existing action recognition datasets are composed of videos that have been manually trimmed to bound the action of interest. This has been identified to be a considerable limitation as it poorly matches how action recognition is applied in practical settings. Therefore, THUMOS 2015 will conduct the challenge on temporally untrimmed videos. The participants may train their methods using trimmed clips but will be required to test their systems on untrimmed data A new forward-looking dataset containing over 430 hours of video data and 45 million frames (70% larger than THUMOS'14) with the following components is made available under this challenge: All videos are collected from YouTube, and will evaluate the success of the proposed methods based on their performance on the new THUMOS 2015 Dataset in two tasks: Participants may either submit a notebook paper that briefly describes their system, or a research paper detailing their approach. All of the submission results will be summarized during the workshop and included in the workshopconference proceedings. Additionally, the top performers will be invited to give oral presentations, with remaining entries encouraged to present their work in the poster session. For more details, please see the Evaluation Setup document or the released resources.
提供机构:
帕依提提
AI搜集汇总
数据集介绍
main_image_url
构建方式
THUMOS15数据集的构建基于对视频内容的细致标注,涵盖了20个动作类别。该数据集从多个公开视频库中筛选出高质量的视频片段,并通过人工标注的方式,确保每个动作实例的精确边界和类别标签。此外,数据集还包含了背景帧的标注,以增强模型对动作与非动作的区分能力。
特点
THUMOS15数据集以其丰富的动作类别和高精度的标注著称,特别适用于动作识别和时序动作检测任务。其特点在于不仅提供了动作实例的开始和结束时间,还包含了详细的背景信息,使得模型能够更好地理解动作的上下文。此外,数据集的多样性和复杂性使其成为评估算法性能的理想选择。
使用方法
THUMOS15数据集主要用于训练和评估动作识别及时序动作检测算法。研究者可以通过加载数据集中的视频片段和相应的标注文件,进行模型的训练和验证。在实际应用中,该数据集可用于开发和测试视频分析系统,以实现对复杂动作的自动识别和定位。
背景与挑战
背景概述
THUMOS15数据集是视频分析领域的一个重要基准,由Jiang Wang等人于2015年提出。该数据集旨在解决视频中的动作识别和定位问题,特别是在未修剪的视频中识别和定位特定动作。THUMOS15包含了来自20个不同类别的动作,涵盖了广泛的日常活动,如体育、家庭活动等。其独特之处在于包含了大量未修剪的视频片段,这为研究者提供了一个更具挑战性的环境来测试和改进动作识别算法。该数据集的发布极大地推动了视频分析技术的发展,尤其是在动作识别和时间定位方面,为后续研究提供了丰富的资源和基准。
当前挑战
THUMOS15数据集在构建过程中面临了多个挑战。首先,未修剪视频中的背景噪声和复杂场景使得动作识别变得困难。其次,视频片段的长度和多样性增加了时间定位的复杂性,要求算法能够在长时间跨度内准确识别和定位动作。此外,数据集中动作类别的多样性和不平衡性也对模型的泛化能力提出了高要求。最后,视频质量的差异和部分动作的低可见性进一步增加了数据处理的难度。这些挑战不仅考验了算法的鲁棒性和精确性,也为视频分析领域的研究提供了丰富的探索空间。
发展历史
创建时间与更新
THUMOS15数据集创建于2015年,由THUMOS挑战赛组织发布,旨在推动视频动作识别领域的发展。该数据集在2015年首次公开,至今未有官方更新记录。
重要里程碑
THUMOS15数据集的发布标志着视频动作识别领域的一个重要里程碑。它包含了20个动作类别的视频片段,共计2000多个未修剪的视频,其中200个用于验证,213个用于测试。这一数据集的引入极大地推动了基于未修剪视频的动作识别研究,为算法开发和性能评估提供了标准化的基准。
当前发展情况
THUMOS15数据集自发布以来,已成为视频动作识别研究中的重要资源。它不仅促进了多种先进算法的开发,如基于深度学习的动作识别模型,还为学术界和工业界提供了一个统一的评估平台。尽管近年来有新的数据集不断涌现,THUMOS15仍然因其丰富的数据量和多样的动作类别而保持其重要地位,继续在推动视频分析技术的发展中发挥关键作用。
发展历程
  • THUMOS15数据集首次发布,旨在推动视频动作识别领域的发展,包含20类动作的200个未修剪视频和1010个修剪视频。
    2015年
  • THUMOS15数据集在多个国际会议和期刊上被广泛引用,成为视频动作识别研究的标准基准之一。
    2016年
  • 基于THUMOS15数据集的研究成果显著增加,推动了视频动作识别技术的进步,特别是在时序动作定位方面。
    2017年
  • THUMOS15数据集被用于验证多种新型深度学习模型的有效性,进一步巩固了其在该领域的核心地位。
    2018年
  • THUMOS15数据集的扩展和改进版本开始出现,研究人员开始探索如何更好地利用其丰富的视频数据进行更复杂的动作识别任务。
    2019年
  • THUMOS15数据集的影响力持续扩大,被广泛应用于视频分析、行为识别和智能监控等多个领域。
    2020年
常用场景
经典使用场景
在视频分析领域,THUMOS15数据集以其丰富的标注信息和多样的视频内容,成为动作识别和视频分类研究中的经典基准。研究者们利用该数据集进行深度学习模型的训练和评估,特别是在卷积神经网络(CNN)和循环神经网络(RNN)的结合应用中,THUMOS15展示了其在捕捉视频序列中复杂动作模式方面的强大能力。
衍生相关工作
基于THUMOS15数据集,研究者们开发了多种先进的动作识别模型,如Two-Stream CNNs和3D CNNs,这些模型在多个国际竞赛中取得了优异成绩。此外,THUMOS15还激发了关于视频时序建模和多任务学习的研究,推动了视频分析技术的整体进步。相关工作还包括对数据集的扩展和改进,以适应不断变化的研究需求和技术发展。
数据集最近研究
最新研究方向
在视频理解领域,THUMOS15数据集因其丰富的标注信息和多样的视频内容,成为研究者们探索动作识别和时序行为检测的重要平台。近期,该数据集的前沿研究主要集中在提升模型对复杂场景下动作的识别精度,以及增强模型在长视频中的时序定位能力。研究者们通过引入多模态融合技术,如视觉与音频信息的结合,以及利用自监督学习方法来预训练模型,从而在THUMOS15上取得了显著的性能提升。这些研究不仅推动了视频理解技术的发展,也为实际应用中的视频内容分析提供了新的思路和方法。
相关研究论文
  • 1
    THUMOS Challenge: Action Recognition with a Large Number of ClassesUniversity of Central Florida · 2015年
  • 2
    Temporal Action Detection with Structured Segment NetworksUniversity of California, Los Angeles · 2017年
  • 3
    Rethinking the Faster R-CNN Architecture for Temporal Action LocalizationUniversity of California, Berkeley · 2018年
  • 4
    Bsn: Boundary sensitive network for temporal action proposal generationTsinghua University · 2018年
  • 5
    Completeness Modeling and Context Separation for Weakly Supervised Temporal Action LocalizationUniversity of California, Los Angeles · 2019年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录

基于站点观测的中国1km土壤湿度日尺度数据集(2000-2022)

本研究提供了中国范围1km高质量的土壤湿度数据集-SMCI1.0(Soil Moisture of China by in situ data, version 1.0),SMCI1.0是包含2000-2022年、日尺度、以10厘米为间隔10层深度(10-100cm)的高时空分辨率土壤湿度,数据单位为0.001m³/m³,缺失值为-999,投影为WGS1984。该数据集是以中国气象局提供的1,648个站点观测10层土壤湿度作为基准,使用ERA5_Land气象强迫数据、叶面积指数(LAI)、土地覆盖类型(Landtypes)、地形(DEM)和土壤特性(Soil properties)作为协变量,通过机器学习方式获得。本研究进行了两组实验以验证SMCI1.0的精度,时间尺度上:ubRMSE为0.041-0.052,R为0.883-0.919;空间尺度上:ubRMSE为0.045-0.051,R为0.866-0.893。 由于SMCI1.0是基于实地观测的土壤湿度,它可以作为现有基于模型和卫星数据集的有效补充。该数据产品可用于各种水文、气象、生态分析和建模,尤其在需要高质量、高分辨率土壤湿度的应用上至关重要。有关数据集的引用及详细描述,请阅读说明文档。为便于使用,本研究提供了两种不同分辨率的版本:30 秒(~1km)和0.1度(~9km)。

国家青藏高原科学数据中心 收录

中国逐日降水数据集(1961-2022,0.1°/0.25°/0.5°)

CHM_PRE数据集基于中国境内及周边1961至今共2839个站点的日降水观测,在传统的“降水背景场 + 降水比值场”的数据集构建思路上,尝试应用月值降水约束和地形特征校正,并依据中国范围内约4万个高密度站点2015–2019年的日降水量插值后数据进行精度评价。经评估认为,CHM_PRE可以较好的表征降水的空间变异性,其日值时间序列与高密度站点日值降水观测结果之间的相关系数中位数为0.78,均方根误差中位数为8.8 mm/d,KGE值中位数为0.69,与目前常用的降水数据集(CGDPA、CN05.1、CMA V2.0)有很好的一致性。 数据集的时间范围为1961年至今,空间分辨率为0.1°、0.25°和0.5°,经纬度范围为18°N–54°N, 72°E–136°E。

国家青藏高原科学数据中心 收录

中国人口普查分县数据(2000、2010、2020年)

中国人口普查分县数据(2000、2010、2020年)数据集是中国第五次、第六次、第七次人口普查分县数据

国家地球系统科学数据中心 收录