SPEECH-COCO

Name: SPEECH-COCO
Creator: OpenDataLab
Published: 2026-05-17 07:30:03
License: 暂无描述

OpenDataLab2026-05-17 更新2024-05-09 收录

下载链接：

https://opendatalab.org.cn/OpenDataLab/SPEECH-COCO

下载链接

链接失效反馈

官方服务：

资源简介：

我们的语料库是MS COCO图像识别和字幕数据集的扩展。COCO女士包含与五个字幕配对的图像。然而，它不包括任何言论。因此，我们使用Voxygen的文本到语音系统来合成可用的字幕。语音作为一种新的方式的添加使MSCOCO能够用于语言习得，无监督的术语发现，关键字发现或使用语音和视觉的语义嵌入领域的研究。

提供机构：

OpenDataLab

创建时间：

2022-05-05

搜集汇总

数据集介绍