HiEve
收藏arXiv2023-07-13 更新2024-06-21 收录
下载链接:
http://humaninevents.org
下载链接
链接失效反馈官方服务:
资源简介:
HiEve是一个大规模的数据集,专注于复杂事件中的人类中心视频分析。由上海交通大学电子工程系创建,包含32个视频序列,主要用于理解人类动作、姿势和行为。数据集包含超过100万个姿势和56,000多个动作实例,适用于多对象跟踪、姿势估计和动作识别等任务。HiEve特别关注于拥挤和复杂事件场景,旨在通过其多样化的标注提升视频理解技术。
HiEve is a large-scale dataset dedicated to human-centric video analysis in complex event scenarios. It was created by the Department of Electronic Engineering, Shanghai Jiao Tong University, and comprises 32 video sequences, primarily intended for understanding human actions, postures and behaviors. The dataset contains over 1 million pose annotations and more than 56,000 action instances, and is suitable for tasks including multi-object tracking, pose estimation and action recognition. HiEve specifically focuses on crowded and complex event scenarios, with the goal of advancing video understanding technologies via its diverse annotations.
提供机构:
上海交通大学电子工程系
创建时间:
2020-05-10
搜集汇总
数据集介绍

构建方式
在智能城市背景下,复杂事件中的人体中心视频分析面临密集人群、异常个体及集体行为等挑战。为应对现有数据集在规模和场景覆盖上的局限,HiEve数据集通过系统化流程构建:首先从机场、餐厅、街道等12类现实场景中采集32段视频序列,部分为自主拍摄并获参与者同意,部分来自YouTube等在线资源且已模糊可识别信息;随后与专业标注公司合作,采用分层标注策略,依次为视频中每个人标注14个关键点的人体姿态、每20帧标注14类行为实例,并通过时序继承与双重校验机制确保标注质量与一致性;最终形成包含超过100万姿态标注、5.6万行为实例及2687条长轨迹的大规模数据集。
使用方法
HiEve数据集支持多目标跟踪、多人姿态估计、姿态跟踪和行为识别四大核心任务,并配备了相应的评估指标。研究者可利用其提供的训练-测试划分(19段训练视频、13段测试视频)进行模型开发与评估。对于多任务学习,数据集鼓励利用其跨标注信息设计增强型基线,例如论文中提出的姿态感知行为识别和动作引导姿态估计算法,通过融合不同层次监督信号提升模型性能。此外,数据集适用于模型预训练,其包含的复杂场景先验知识可迁移至其他下游任务。评估可通过在线服务器进行,除传统指标外,数据集还引入了加权MOTA、加权AP等新指标,以更全面衡量算法在拥挤和复杂事件上的鲁棒性。
背景与挑战
背景概述
随着智慧城市建设的深入发展,以人为中心的视频分析技术面临着解析真实场景中复杂多样化事件的严峻挑战。为应对这一需求,上海交通大学等机构的研究团队于2023年正式发布了HiEve数据集,旨在为复杂事件下的人体运动、姿态与行为理解提供大规模基准。该数据集聚焦于密集人群、异常个体及集体行为等现实场景,涵盖了从机场、车站到广场等12类不同环境,共包含32段视频序列。HiEve以其超过百万的姿态标注、五万余个复杂事件行为实例以及平均长度超过480帧的轨迹数据,显著拓展了现有数据集的规模与覆盖范围,为计算机视觉领域在拥挤与复杂场景下的算法研发与评估奠定了关键基础。
当前挑战
HiEve数据集致力于解决复杂事件下以人为中心的视频分析问题,其核心挑战在于对密集遮挡、异常行为及长时身份关联的精准建模。具体而言,数据构建过程中面临多重困难:在场景采集方面,需平衡事件多样性、隐私合规性与数据真实性,确保视频涵盖地震逃生、冲突等紧急事件与日常复杂场景;在标注层面,由于人群密集与严重遮挡,姿态关键点与行为标签的标注需要极高的专业性与一致性,团队通过多轮交叉校验与置信度评分机制保障质量;此外,数据的长尾分布与轨迹中断现象进一步增加了算法在处理重现识别与时空连续性上的难度,对现有多目标跟踪、姿态估计与行为识别方法提出了更为严苛的效能考验。
常用场景
经典使用场景
在智能城市与复杂事件分析领域,HiEve数据集为密集人群场景下的多任务视频理解提供了基准平台。其经典使用场景集中于对复杂事件中人体姿态、轨迹与行为的联合分析,例如在地震逃生、地铁拥挤、餐厅聚餐等现实场景中,研究者可利用该数据集同时评估多目标跟踪、姿态估计与动作识别算法的综合性能。通过提供超过百万级姿态标注、五万余动作实例及长时轨迹数据,HiEve使得模型能够在高度遮挡、群体交互的挑战性环境下进行端到端的训练与验证,推动了面向现实场景的多模态人体分析研究。
解决学术问题
HiEve数据集主要解决了复杂事件场景下人体中心视频分析的三大核心学术问题:其一,突破了传统数据集中在简单场景与有限标注上的局限,为密集遮挡、异常行为、群体交互等现实挑战提供了大规模标注数据;其二,通过统一标注框架下的姿态、轨迹与动作多层次信息,促进了跨任务知识迁移与联合优化方法的发展;其三,针对长时轨迹跟踪、细粒度动作识别等难题,设计了加权评估指标(如w-MOTA、wf-mAP),推动算法在复杂场景中的鲁棒性提升。该数据集通过层次化标注体系与复杂事件覆盖,为人体分析领域提供了更贴近实际应用的评估基准与研究范式。
实际应用
在实际应用层面,HiEve数据集为智能安防、公共管理、人机交互等领域提供了关键技术支撑。在公共安全场景中,其标注的异常行为(如打架、跌倒)与群体事件(如聚集、排队)可用于开发实时异常检测与人群态势感知系统;在交通管理领域,长时轨迹数据有助于优化行人流量分析与拥堵预测模型;在智能零售或服务机器人场景中,细粒度动作识别能力可辅助理解顾客行为或人类交互意图。通过提供贴近真实世界复杂性的数据,HiEve助力算法在实际部署中应对遮挡频繁、视角多变、行为交织等挑战,提升系统在开放环境中的实用性与可靠性。
数据集最近研究
最新研究方向
在智能城市与复杂事件分析领域,HiEve数据集作为大规模、多标注的人本视频分析基准,正推动着多项前沿研究方向的发展。其核心在于利用密集的人群场景、异常行为与集体活动等复杂事件标注,促进跨任务协同学习。当前研究热点聚焦于基于多层级标注的联合优化框架,例如通过姿态感知的动作识别与动作引导的姿态估计,实现不同视觉任务间的信息互补与性能提升。同时,针对拥挤场景下的长时轨迹跟踪与遮挡处理,研究者们正探索利用HiEve提供的长轨迹与断开轨迹标注,开发更具鲁棒性的重识别与时空一致性模型。这些进展不仅提升了模型在真实复杂场景中的泛化能力,也为安防监控、公共安全管理等实际应用提供了关键技术支撑。
相关研究论文
- 1Human in Events: A Large-Scale Benchmark for Human-centric Video Analysis in Complex Events上海交通大学电子工程系 · 2023年
以上内容由遇见数据集搜集并总结生成



