HD-EPIC

github2025-03-04 更新2025-02-14 收录

下载链接：

https://github.com/hd-epic/hd-epic-annotations

下载链接

链接失效反馈

官方服务：

资源简介：

一个高详细度的自我中心视频数据集

A highly detailed egocentric video dataset

创建时间：

2025-02-05

原始信息汇总

HD-EPIC: 高详细度的自我中心视频数据集

数据集描述

数据集名称：HD-EPIC
数据集类型：自我中心视频数据集
详细程度：高详细度
数据集构成：包含视频、视频描述、动作标注、对象移动标注、音频标注、活动标注、食谱和营养信息

数据集文件

视频描述文件：
- HD_EPIC_Narrations.pkl：包含动作描述和相关标注
- HD_EPIC_verb_classes.csv：动词聚类信息
- HD_EPIC_noun_classes.csv：名词聚类信息
对象移动标注文件：
- scene-and-object-movements/hd-epic-scene-and-object-movements.json：包含对象移动的3D位置、2D边界框和分配的设备信息
音频标注文件：
- HD-EPIC-Sounds.csv：音频标注信息
活动标注文件：
- PXX_recipe_timestamps.csv：活动时间戳
- complete_recipes.json：食谱详情
VQA基准测试文件：包含用于VQA基准测试的问题
YouTube链接文件：
- HD_EPIC_VQA_Interface.html：VQA问题可视化界面

数据集特点

动作描述：提供每个动作的详细描述、时间戳、名词和动词列表、动作类别等
对象移动标注：标注对象从拿起到放置的时间段和2D边界框
音频标注：标注音频片段的类别和时间
活动标注：标注高级行为和食谱步骤
营养信息：提供食谱中每个成分的营养信息

引用信息

当使用该数据集时，请参考以下信息：

@article{perrett2025hdepic, author = {Perrett, Toby and Darkhalil, Ahmad and Sinha, Saptarshi and Emara, Omar and Pollard, Sam and Parida, Kranti and Liu, Kaiting and Gatti, Prajwal and Bansal, Siddhant and Flanagan, Kevin and Chalk, Jacob and Zhu, Zhifan and Guerrier, Rhodri and Abdelazim, Fahd and Zhu, Bin and Moltisanti, Davide and Wray, Michael and Doughty, Hazel and Damen, Dima}, title = {HD-EPIC: A Highly-Detailed Egocentric Video Dataset}, journal = {arXiv preprint}, volume = {arXiv:2502.XXXXX}, year = {2025}, month = {February}, }

搜集汇总

数据集介绍

构建方式

HD-EPIC数据集通过采集参与者进行日常活动时的第一视角视频，并对视频中的动作、场景和对象进行详尽的标注构建而成。该数据集包含了多个参与者在多种环境下执行的不同活动，视频被分割为动作描述和对应的标注信息，包括时间戳、动词、名词、动作类别等，旨在为研究提供高度详细的第一视角视频数据。

使用方法

使用HD-EPIC数据集时，用户可以从项目网页下载相关视频和数据标注文件。数据集提供了多个CSV和Pickle文件，包含了视频的详细标注信息。用户可以根据需要，利用这些标注来分析参与者的行为模式，对象移动轨迹，以及音频事件等。此外，数据集还支持VQA-benchmark，允许用户进行视觉问答的研究。

背景与挑战

背景概述

HD-EPIC数据集，全称为Highly-Detailed Egocentric Video Dataset，是由Perrett等研究人员于2025年创建的一组详尽的自我中心视频数据集。该数据集旨在为 egocentric 视频理解领域提供高质量的资源，其核心研究问题包括动作识别、场景理解等。HD-EPIC数据集通过精确的时间戳标注、动作描述以及丰富的场景和对象运动注释，对相关领域产生了显著的影响。

当前挑战

该数据集面临的挑战主要包括：一是动作和场景理解的准确性，由于 egocentric 视频的视角限制，准确识别和分类动作类型存在一定难度；二是构建过程中的标注一致性，确保各个标注者对动作和对象的描述具有高度的一致性；三是数据集的扩展性，如何有效地整合更多的场景和动作类型，以增强数据集的适用范围和泛化能力。

常用场景

经典使用场景

HD-EPIC数据集作为一份高度详细的第一人称视频资料，其经典使用场景在于对参与者进行日常生活活动的细致记录与分析。研究者可以借此数据集深入探索个体在执行烹饪、整理等任务时的动作描述、时间标注以及对象互动，进而对人类行为模式进行建模与理解。

解决学术问题

该数据集解决了行为识别、自然语言处理以及场景理解等学术研究中的关键问题。通过提供高度标注的动作、对象和场景信息，HD-EPIC极大地促进了自动化标注和动作分类的研究进展，为理解人类日常行为提供了丰富的数据资源。

实际应用

在实际应用中，HD-EPIC数据集可用于开发智能辅助系统，如智能家居中的自动任务识别与执行，以及个人健康监测系统中的活动分析。此外，它还可作为虚拟现实和增强现实系统的行为数据库，增强用户体验的沉浸感。

数据集最近研究