five

it-just-works/vast27m_annotations

收藏
Hugging Face2024-09-10 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/it-just-works/vast27m_annotations
下载链接
链接失效反馈
官方服务:
资源简介:
VAST-27M数据集包含多模态数据的注释,包括视觉、音频、字幕和文本信息。该数据集旨在支持全模态基础模型的开发。每个数据条目包括剪辑ID、URL、开始和结束时间(以秒和时间戳格式)、视觉描述、音频描述、字幕和VAST描述(组合的多模态描述)。

The VAST-27M dataset contains annotations for multi-modal data, including vision, audio, subtitle, and text information. It was created to support the development of omni-modality foundation models. Each entry in the dataset includes: Clip ID, URL, Start and end times (in seconds and timestamp format), Vision captions, Audio captions, Subtitles, VAST captions (combined multi-modal descriptions).
提供机构:
it-just-works
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作