1rsh/tts-rj-hi-karya
收藏Hugging Face2024-02-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/1rsh/tts-rj-hi-karya
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含参与者阅读Rajasthani Hindi故事的音频记录,每次阅读一个句子。共有来自印度拉贾斯坦邦Soda的98名参与者,每人阅读30个故事。总计有426872条录音,其中大约有58名男性和40名女性参与者。需要注意的是,虽然随机抽样表明大多数用户已尽力准确阅读句子,但未对数据进行质量分析,因此某些录音可能存在错误。
该数据集包含参与者阅读Rajasthani Hindi故事的音频记录,每次阅读一个句子。共有来自印度拉贾斯坦邦Soda的98名参与者,每人阅读30个故事。总计有426872条录音,其中大约有58名男性和40名女性参与者。需要注意的是,虽然随机抽样表明大多数用户已尽力准确阅读句子,但未对数据进行质量分析,因此某些录音可能存在错误。
提供机构:
1rsh
原始信息汇总
Rajasthani Hindi Speech Dataset
概述
该数据集包含参与者在拉贾斯坦语(Rajasthani Hindi)中逐句朗读故事的音频记录。共有98名来自Soda, Rajasthan的参与者,每位参与者朗读了30个故事。总计有426,872条录音。参与者中大约有58名男性和40名女性。
注意: 尽管随机抽样表明大多数用户都尽力准确地朗读了句子,但我们尚未对数据进行任何质量分析。某些录音可能存在错误。
数据集结构
数据集包含两个字段:音频和句子,分别包含音频文件和相应的句子。
数据集信息
- 语言: 拉贾斯坦语(Rajasthani Hindi)
- 许可证: MIT
- 大小类别: 100K<n<1M
- 任务类别: 文本转语音、自动语音识别
- 美观名称: Rajasthani Hindi Speech Dataset
特征
- 音频: 音频类型
- 句子: 字符串类型
分割
- 训练集: 7,425,995,581.812981字节,422,603个样本
- 测试集: 74,991,388.79801954字节,4,269个样本
下载和数据集大小
- 下载大小: 7,504,372,330字节
- 数据集大小: 7,500,986,970.611字节
配置
- 默认配置:
- 训练集路径: data/train-*
- 测试集路径: data/test-*
标签
- webdataset



