Clotho 音频字幕数据集
收藏超神经2022-09-22 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/17418
下载链接
链接失效反馈官方服务:
资源简介:
Clotho 是一个 audio captioning 数据集。该数据集侧重于音频的内容,以及字幕的多样性,由 4,981 个音频样本组成,每个音频样本有 5 个字幕(总共 24,905 个字幕),持续时间为 15 到 30 秒,字幕长度为 8 到 20 个单词。
Clotho is an audio captioning dataset. This dataset focuses on audio content and the diversity of captions. It consists of 4,981 audio samples, each paired with 5 captions, totaling 24,905 captions overall. The duration of each audio sample ranges from 15 to 30 seconds, and each caption has a length of 8 to 20 words.
创建时间:
2022-09-20
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



