CORAA

Name: CORAA
Creator: OpenDataLab
Published: 2026-05-17 07:30:36
License: 暂无描述

OpenDataLab2026-05-17 更新2024-05-09 收录

下载链接：

https://opendatalab.org.cn/OpenDataLab/CORAA

下载链接

链接失效反馈

官方服务：

资源简介：

CORAA是巴西葡萄牙语自动语音识别 (ASR) 的公开数据集，包含290.77小时的音频及其各自的转录 (400k分段音频)。该数据集由5个原始项目的音频组成: 阿利普 (贡萨尔维斯，2019) 巴西口服 (拉索和梅洛，2012) NURC-累西腓 (小奥利维埃拉，2016) SP-2010 (门德斯和大四郎，2012) TEDx会谈 (葡萄牙语会谈) 音频要么由注释者验证，要么针对ASR任务首次转录。

提供机构：

OpenDataLab

创建时间：

2023-02-01

搜集汇总

数据集介绍