HOD
收藏EgoHOD 数据集概述
数据集简介
EgoHOD是一个专注于第一视角视频中手与物体动态的表征学习的数据集。该数据集通过结合手-物体检测器和大型语言模型生成高质量的描述手-物体动态的叙述。为了捕捉这些细粒度的动态,研究者提出了EgoVideo模型,该模型包含一种轻量级运动适配器,能够有效地利用HOD数据中的手-物体动态。
数据集获取
- HOD数据集的注释可以通过Huggingface链接获取。
预训练模型
- 预训练的EgoVideo模型可以通过此链接下载。
使用说明
-
安装步骤如下:
git clone https://github.com/OpenRobotLab/EgoHOD.git conda env create -f environment.yml conda activate hod pip install -r requirements.txt
-
预训练代码可以通过运行以下命令来执行: shell bash ./exps/pretrain.sh
-
零样本评估可以通过运行以下命令来执行: shell bash exps/eval_ekcls.sh
-
数据集的引用格式如下: latex @misc{pei2025modeling, title={Modeling Fine-Grained Hand-Object Dynamics for Egocentric Video Representation Learning}, author={Baoqi Pei, Yifei Huang, Jilan Xu, Guo Chen, Yuping He, Lijin Yang, Yali Wang, Weidi Xie, Yu Qiao, Fei Wu, Limin Wang}, year={2025}, eprint={2503.00986}, archivePrefix={arXiv}, primaryClass={cs.CV} }




