five

OpenGait|步态识别数据集|人工智能数据集

收藏
arXiv2024-05-15 更新2024-06-21 收录
步态识别
人工智能
下载链接:
https://github.com/ShiqiYu/OpenGait
下载链接
链接失效反馈
资源简介:
OpenGait是一个灵活高效的步态识别平台,由南方科技大学计算机科学与工程系开发。该数据集旨在通过深入的消融实验,重新审视步态识别的最新进展,并发现先前方法中的一些不完美部分,从而提出三个结构简单但经验强大且实用稳健的基线模型。OpenGait支持所有上述步态模式,无论传感器类型如何,并已被广泛应用于两个主要的国际步态识别竞赛中,旨在激发步态识别的进一步研究和应用,以提高实用性。
提供机构:
南方科技大学计算机科学与工程系
创建时间:
2024-05-15
AI搜集汇总
数据集介绍
main_image_url
构建方式
在步态识别领域,现有的方法在室内环境下取得了显著进展,但在应用于新发布的真实世界步态数据集时,往往表现不佳。为了解决这一问题,研究团队开发了OpenGait,一个灵活高效的步态识别平台。通过使用OpenGait作为基础,研究团队进行了深入的消融实验,重新审视了近年来步态识别的发展,并发现了某些先前方法的不完善之处,从而得出了几个关键但未被发现的见解。基于这些发现,研究团队开发了三个结构简单但经验上强大且实际稳健的基线模型,分别代表了基于外观、基于模型和多模态的步态模式描述方法。
特点
OpenGait数据集的特点在于其全面性和实用性。该数据集不仅涵盖了多种最先进的步态识别方法,还包含了在真实环境中捕获的新兴步态数据集。此外,OpenGait平台具有高度的可扩展性和可重用性,已被扩展到多个潜在有影响力的存储库,并被广泛应用于国际步态识别竞赛中。通过广泛的实验,研究团队揭示了浅层与深层步态模型建模经验、典型步态模态的表示能力等关键见解。
使用方法
OpenGait数据集的使用方法包括数据加载、采样和预处理,以及模型训练和评估。数据模块负责加载、采样和预处理输入数据流,建模模块基于基类预定义深度模型在训练和测试阶段的行为,包括优化和推理。评估模块用于评估获得模型的性能。OpenGait平台支持多种步态模态和框架,兼容常用的步态数据集,并支持最先进的方法。研究人员可以通过该平台进行系统分析和比较,从而推动步态识别领域的进一步研究和应用。
背景与挑战
背景概述
OpenGait数据集由南方科技大学计算机科学与工程系的Chao Fan、Saihui Hou、Junhao Liang、Chuanfu Shen、Jingzhe Ma、Dongyang Jin、Yongzhen Huang和Shiqi Yu等人于2024年创建。该数据集的核心研究问题是如何在实际应用中提升步态识别的实用性,特别是在室内外不同环境下步态识别方法的泛化能力。OpenGait不仅提供了一个灵活高效的步态识别平台,还通过深入的消融实验重新审视了近期步态识别的发展,揭示了现有方法的不足,并提出了三个结构简单但经验上强大且实用的基线模型。这些研究成果对步态识别领域具有重要影响,特别是在推动步态识别技术从实验室环境向实际应用场景的转变方面。
当前挑战
OpenGait数据集面临的挑战主要集中在两个方面:一是解决步态识别在实际应用中的泛化问题,特别是在复杂背景、光照变化和遮挡等现实因素下的表现;二是在构建过程中,如何处理不同步态数据集之间的差异,确保方法在多种数据集上的通用性和鲁棒性。此外,现有步态识别方法在处理大规模真实世界数据集时,往往表现出显著的性能下降,这表明现有方法在面对实际应用中的噪声和复杂性时存在局限性。因此,OpenGait的研究不仅需要提升模型性能,还需要增强模型在实际环境中的适应性和鲁棒性。
常用场景
经典使用场景
在步态识别领域,OpenGait数据集的经典使用场景主要集中在通过深度学习模型对步态特征进行提取和识别。该数据集支持多种步态模态,包括外观特征、模型特征和多模态特征,为研究人员提供了一个灵活且高效的步态识别平台。通过OpenGait,研究者可以进行深入的消融实验,重新审视和评估现有的步态识别方法,从而发现并解决现有方法在实际应用中的不足。
衍生相关工作
OpenGait数据集的发布和应用催生了一系列相关的经典工作。例如,基于OpenGait平台的Gait3D-Benchmark和FastPoseGait等扩展库,进一步推动了步态识别技术的发展。此外,OpenGait还被广泛应用于国际步态识别竞赛中,如HID和GREW,许多获奖团队都采用了OpenGait作为其解决方案的基础代码库,展示了其在步态识别领域的广泛影响力和实际应用价值。
数据集最近研究
最新研究方向
在步态识别领域,OpenGait数据集的最新研究方向主要集中在提升步态识别在实际应用中的实用性和鲁棒性。研究者们通过开发灵活高效的步态识别平台OpenGait,并在此基础上进行深入的消融实验,重新审视了近期步态识别方法的发展。研究发现,现有方法在处理新发布的真实世界步态数据集时表现不佳,且室内步态数据集的结论难以推广到户外环境。因此,研究重点转向了开发结构简单但实验效果强大且实用的基线模型,如DeepGaitV2、SkeletonGait和SkeletonGait++,分别代表基于外观、模型和多模态的步态模式描述方法。这些研究不仅在性能上达到了最先进水平,更重要的是为深度步态模型的建模经验、典型步态模态的表示能力等提供了新的见解,旨在激发步态识别研究向更高实用性的方向发展。
相关研究论文
  • 1
    OpenGait: A Comprehensive Benchmark Study for Gait Recognition towards Better Practicality南方科技大学计算机科学与工程系 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录

Med-MAT

Med-MAT是一个包含106个开源医学数据集的视觉问答(VQA)数据集,旨在推动医学多模态大语言模型(MLLMs)的泛化实验和训练。数据集通过将图像-标签对转换为VQA格式,展示了组合泛化(CG)是MLLMs理解未见图像的关键机制。数据集包括106个医学数据集的问答对、53个按模态、解剖区域和任务(MAT)分类的子集的问答对,以及部分数据集的图像下载链接。

huggingface 收录

Natural Scene Braille Character Recognition Dataset

There are a total of 1157 Braille segment images in this dataset, including 925 in the training set and 232 in the testing set. There are two folders in the directory of this dataset: character_label and segment_label. The character_rabel file contains three formats of Braille segment images: (1) Braille segment images and label files stored in ICDAR-2015 format, each. jpg file corresponds to a. txt file, where each line stores the position and recognition label of a braille character rectangle box. The data corresponds to the coordinates of the four points in the rectangle box and the recognized numerical label; (2) The original format of the data is stored in the folder org. Each .jpg file in this folder corresponds to a .json file which marked by labelme software; (3) VOC format, stored in voc-data folder. This folder stores images and corresponding .xml files in VOC format, and marks the position of each braille character rectangle box and its corresponding numerical label information in the .xml file. In addition, the original Braille images of natural scenes and the corresponding Braille segment markings .json files are stored in the folder segment_label.

DataCite Commons 收录

中国高分辨率高质量PM2.5数据集(2000-2023)

ChinaHighPM2.5数据集是中国高分辨率高质量近地表空气污染物数据集(ChinaHighAirPollutants, CHAP)中PM2.5数据集。该数据集利用人工智能技术,使用模式资料填补了卫星MODIS MAIAC AOD产品的空间缺失值,结合地基观测、大气再分析和排放清单等大数据生产得到2000年至今全国无缝隙地面PM2.5数据。数据十折交叉验证决定系数R2为0.92,均方根误差RMSE为10.76 µg/m3。主要范围为整个中国地区,空间分辨率为1 km,时间分辨率为日、月、年,单位为µg/m3。注意:该数据集持续更新,如需要更多数据,请发邮件联系作者(weijing_rs@163.com; weijing@umd.edu)。 数据文件中包含NC转GeoTiff的四种代码(Python、Matlab、IDL和R语言)nc2geotiff codes。

国家青藏高原科学数据中心 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录