five

ImageNet-VidVRD

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/ImageNet-VidVRD
下载链接
链接失效反馈
官方服务:
资源简介:
ImageNet-VidVRD 数据集包含从 ILVSRC2016-VID 数据集中根据视频是否包含清晰的视觉关系选择的 1,000 个视频。它分为 800 个训练集和 200 个测试集,涵盖 35 个类别的常见主语/宾语和 132 个类别的谓词。有 10 人对数据集进行了标注,包括对象轨迹标注和关系标注。由于 ILVSRC2016-VID 数据集已经有 30 个类别的对象轨迹注释,我们通过标记其余 5 个类别来补充注释。为了节省关系标记的工作,我们标记了训练集中视频的典型片段和测试集中的整个视频。

The ImageNet-VidVRD dataset consists of 1,000 videos selected from the ILVSRC2016-VID dataset based on whether the videos contain clear visual relationships. It is split into 800 training videos and 200 test videos, covering 35 common subject/object categories and 132 predicate categories. A total of 10 annotators participated in the labeling work, which includes object trajectory annotation and relationship annotation. Since the ILVSRC2016-VID dataset already has object trajectory annotations for 30 categories, we supplemented the annotations by labeling the remaining 5 categories. To reduce the workload of relationship labeling, we only labeled typical segments of videos in the training set and full videos in the test set.
提供机构:
OpenDataLab
创建时间:
2022-05-30
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
ImageNet-VidVRD是一个专注于视频视觉关系检测的数据集,包含从ILVSRC2016-VID数据集中筛选的1,000个视频,分为800个训练集和200个测试集。它涵盖35个主语/宾语类别和132个谓词类别,标注工作由10人完成,包括对象轨迹和关系标注,并补充了原有数据集中未覆盖的5个类别。该数据集由新加坡国立大学、哥伦比亚大学和南京大学于2017年发布,旨在支持视频中视觉关系的识别和分析任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作