five

LJSpeech

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/xnx98/LJSpeech
下载链接
链接失效反馈
官方服务:
资源简介:
This is a public domain speech dataset consisting of 13,100 short audio clips of a single speaker reading passages from 7 non-fiction books. A transcription is provided for each clip. Clips vary in length from 1 to 10 seconds and have a total length of approximately 24 hours. The texts were published between 1884 and 1964, and are in the public domain. The audio was recorded in 2016-17 by the LibriVox project and is also in the public domain.

本数据集为公有领域(public domain)语音数据集,共包含13100条短音频片段,均由同一位朗读者朗读7部非虚构类书籍中的篇章录制而成。每条音频片段均配有对应的转录文本。单条片段时长介于1秒至10秒之间,总时长约为24小时。本次数据集使用的文本于1884年至1964年间出版,均属于公有领域。音频部分于2016至2017年间由LibriVox项目录制,同样属于公有领域。
提供机构:
xnx98
创建时间:
2025-07-14
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作