Broadcast News 大型文本数据集
收藏超神经2021-01-13 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/5534
下载链接
链接失效反馈官方服务:
资源简介:
Broadcast News 是用于下一个单词预测的大型文本数据集,其中包括 1996 年的广播新闻语音语料库包含来自 ABC,CNN 和 CSPAN 电视网以及 NPR 和 PRI 无线电网络的 104 小时广播,并附有相应的成绩单。
Broadcast News is a large-scale text dataset designed for next-word prediction. The dataset includes a 1996 broadcast news speech corpus that contains 104 hours of broadcast content from ABC, CNN, CSPAN television networks, as well as NPR and PRI radio networks, with corresponding transcripts attached.
创建时间:
2019-03-08
搜集汇总
数据集介绍

背景与挑战
背景概述
Broadcast News 是一个用于下一个单词预测的大型文本数据集,包含1996年来自多个电视和无线电网络的104小时广播新闻语音语料库及转录。该数据集由宾夕法尼亚大学于1997年发布,旨在为DARPA HUB4项目提供广播领域连续语音识别的训练数据。
以上内容由遇见数据集搜集并总结生成



