five

LibriSpeech-PC

收藏
arXiv2023-10-05 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2310.02943v1
下载链接
链接失效反馈
官方服务:
资源简介:
LibriSpeech-PC数据集是基于LibriSpeech的一个改进版本,专门设计用于评估端到端自动语音识别(ASR)模型在标点和大写预测方面的能力。该数据集通过追踪原始文本来源并将其与LibriSpeech的转录本对齐,恢复了标点和大写信息。数据集保留了原始LibriSpeech的样本分割和子集划分,适用于训练和评估具有标点和大写预测功能的ASR模型。LibriSpeech-PC数据集的应用领域主要集中在提高ASR输出的可读性和格式正确性,解决传统ASR模型输出无标点和全小写文本的问题。
提供机构:
NVIDIA, 圣克拉拉, 美国
创建时间:
2023-10-05
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作