Clotho
收藏魔搭社区2025-12-02 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/Clotho
下载链接
链接失效反馈官方服务:
资源简介:
displayName: Clotho
license:
- Clotho Custom
paperUrl: arxiv.org/pdf/1910.09387v1.pdf
publishDate: "2019"
publishUrl: zenodo.org/record/3490684#.YwSWEXZBxD8
publisher:
- Tampere University
tags:
- foreign colleges and universities
- Language Modeling
- multi-task learning
---
# 数据集介绍
## 简介
Clotho是一个音频字幕数据集。数据集关注音频内容,以及字幕的多样性,由4,981个音频样本组成,每个音频样本5个字幕 (共24,905个字幕),时长15 ~ 30秒,字幕长度8 ~ 20个字。
## Download dataset
:modelscope-code[]{type="git"}
显示名称:Clotho
许可证:Clotho 定制许可证
论文链接:arxiv.org/pdf/1910.09387v1.pdf
发布日期:2019年
发布链接:zenodo.org/record/3490684#.YwSWEXZBxD8
发布机构:坦佩雷大学(Tampere University)
标签:国外高校(Foreign Colleges and Universities)、语言建模(Language Modeling)、多任务学习(Multi-Task Learning)
---
# 数据集介绍
## 简介
Clotho 是一款音频字幕数据集,其核心聚焦于音频内容与字幕表达的多样性。该数据集共收录4981条音频样本,每条音频对应5条字幕,总计生成24905条字幕;单条音频时长介于15至30秒之间,单条字幕的字符长度为8至20字。
## 数据集下载
`modelscope-code[]{type="git"}`
提供机构:
maas
创建时间:
2024-07-11



