five

DiDeMoSV

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/DiDeMoSV
下载链接
链接失效反馈
官方服务:
资源简介:
DiDeMoSV. DiDeMo是一个视频字幕数据集,其中包含10,000短片,其中包含40,000多个文本描述,这些文本描述在时间上与视频进行了本地化。每个剪辑都是从基于Flickr的YFCC100M数据集中随机采样的。这导致视频覆盖了大量的真实场景,包含许多不同的设置、动作、实体等。数据集分别包含训练、验证和测试中的11550/2707/3378个样本,每个样本包含三个连续的帧。与现有的故事可视化数据集相比,该数据集对故事延续模型提出了挑战,以生成多样化的输入,涵盖了更多的故事元素。为了做到这一点,模型必须最大限度地利用初始场景输入,并且需要合并额外的一般视觉知识,无论这是通过转移学习还是额外的数据来完成的。
提供机构:
OpenDataLab
创建时间:
2022-11-02
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作