five

WSJ

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/WSJ
下载链接
链接失效反馈
官方服务:
资源简介:
《华尔街日报》语料库将向DARPA提供其第一个通用英语、大词汇、自然语言、高困惑、包含大量语音数据 (400小时) 和文本数据 (47万字) 的语料库,从而提供了一种在应用领域中集成语音识别和自然语言处理的方法,具有很高的潜在实用价值。本文介绍了包含在多层面的WSJ CSR语料库中的激励目标,声学数据设计,文本处理步骤,词典和测试范例。
提供机构:
OpenDataLab
创建时间:
2023-03-30
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作