LSMDC (Large Scale Movie Description Challenge)

Name: LSMDC (Large Scale Movie Description Challenge)
Creator: OpenDataLab
Published: 2026-05-24 07:30:28
License: 暂无描述

OpenDataLab2026-05-24 更新2024-05-09 收录

下载链接：

https://opendatalab.org.cn/OpenDataLab/LSMDC

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含从 202 部电影中提取的 118,081 个短视频片段。每个视频都有一个字幕，可以从电影剧本中提取，也可以从为视障人士转录的 DVS（描述性视频服务）中提取。验证集包含 7408 个剪辑，并且对来自与训练集和验证集不相交的电影的 1000 个视频的测试集进行评估。

This dataset contains 118,081 short video clips extracted from 202 movies. Each video is accompanied by subtitles, which can be extracted either from movie scripts or from transcripts of DVS (Descriptive Video Service) prepared for visually impaired people. The validation set includes 7,408 clips, and the test set, which consists of 1,000 videos sourced from movies that are disjoint from those used in the training and validation sets, is utilized for model evaluation.

提供机构：

OpenDataLab

创建时间：

2022-08-19

搜集汇总

数据集介绍

背景与挑战

背景概述

LSMDC是一个大规模视频描述数据集，包含从202部电影中提取的118,081个短视频片段，每个视频配有从电影剧本或描述性视频服务（DVS）中提取的字幕。该数据集专为视频描述挑战设计，提供训练、验证和测试集，适用于计算机视觉和自然语言处理任务，由加州大学伯克利分校和马克斯普朗克信息学研究所于2015年发布。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集