five

HVU (Holistic Video Understanding)

收藏
OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/HVU
下载链接
链接失效反馈
官方服务:
资源简介:
HVU 在语义分类中分层组织,重点关注多标签和多任务视频理解作为一个综合问题,包括识别动态场景中的多个语义方面。 HVU 总共包含约 57.2 万个视频,其中包含 900 万个注释,用于训练、验证和测试集,跨越 3142 个标签。 HVU 包含在场景、对象、动作、事件、属性和概念类别上定义的语义方面,这些语义方面自然地捕捉了现实世界的场景。来源:大规模整体视频理解

HVU is hierarchically organized for semantic classification, focusing on multi-label and multi-task video understanding as a unified problem, which involves recognizing multiple semantic aspects in dynamic scenes. In total, HVU comprises approximately 572,000 videos with 9 million annotations across its training, validation, and test splits, spanning 3142 distinct labels. HVU encompasses semantic aspects defined across the categories of scene, object, action, event, attribute, and concept, which naturally capture real-world scenarios. Source: Large-scale Holistic Video Understanding
提供机构:
OpenDataLab
创建时间:
2022-05-23
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
HVU数据集是一个专注于整体视频理解的大规模资源,包含约57.2万个视频和900万个注释,覆盖3142个标签,用于多标签和多任务分析。该数据集由波恩大学和苏黎世联邦理工学院于2020年发布,旨在识别视频中的场景、对象、动作等语义方面。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作