five

MovieNet

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/MovieNet
下载链接
链接失效反馈
官方服务:
资源简介:
用于电影理解的整体数据集 近年来,视觉理解取得了显着进展。然而,如何理解具有艺术风格的基于故事的长视频,例如电影,仍然具有挑战性。在本文中,我们介绍了 MovieNet——一个用于电影理解的整体数据集。 MovieNet 包含 1,100 部电影,包含大量多模态数据,例如预告片、照片、情节描述等。此外,MovieNet 提供了不同方面的手动标注,包括 110 万个带有边界框和身份的字符、42K 场景边界、 2.5K 对齐的描述句子,65K 地点和动作标签,以及 92K 电影风格标签。据我们所知,MovieNet 是最大的数据集,具有最丰富的注释,可用于全面的电影理解。基于 MovieNet,我们设置了多个基准,用于从不同角度理解电影。在这些基准上进行了广泛的实验,以展示 MovieNet 的不可估量的价值以及当前方法在全面理解电影方面的差距。我们相信这样一个整体的数据集将促进基于故事的长视频理解及其他方面的研究。

A Holistic Dataset for Movie Understanding In recent years, remarkable progress has been achieved in visual understanding. However, how to comprehend story-based long-form videos with artistic styles, such as movies, remains a critical challenge. In this work, we introduce MovieNet—a holistic dataset for movie understanding. MovieNet contains 1,100 movies and a vast amount of multimodal data, including trailers, photos, plot descriptions, etc. In addition, MovieNet provides manual annotations covering multiple aspects: 1.1 million characters with bounding boxes and identities, 42K scene boundaries, 2.5K aligned descriptive sentences, 65K location and action labels, and 92K movie style labels. To the best of our knowledge, MovieNet is the largest dataset with the richest annotations for comprehensive movie understanding. Based on MovieNet, we establish several benchmarks for movie understanding from diverse perspectives. Extensive experiments are conducted on these benchmarks to showcase the inestimable value of MovieNet and the gaps of current approaches in comprehensively understanding movies. We believe that such a holistic dataset will advance research on story-based long-form video understanding and beyond.
提供机构:
OpenDataLab
创建时间:
2022-03-17
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
MovieNet是一个用于电影理解的整体数据集,包含1,100部电影,提供丰富的多模态数据和手动标注,如字符识别、场景边界和风格标签。它是目前最大的电影理解数据集,旨在支持全面的电影分析研究,并设置了多个基准以评估方法性能。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作