five

1rsh/tts-rj-hi-karya

收藏
Hugging Face2024-02-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/1rsh/tts-rj-hi-karya
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含参与者阅读Rajasthani Hindi故事的音频记录,每次阅读一个句子。共有来自印度拉贾斯坦邦Soda的98名参与者,每人阅读30个故事。总计有426872条录音,其中大约有58名男性和40名女性参与者。需要注意的是,虽然随机抽样表明大多数用户已尽力准确阅读句子,但未对数据进行质量分析,因此某些录音可能存在错误。

该数据集包含参与者阅读Rajasthani Hindi故事的音频记录,每次阅读一个句子。共有来自印度拉贾斯坦邦Soda的98名参与者,每人阅读30个故事。总计有426872条录音,其中大约有58名男性和40名女性参与者。需要注意的是,虽然随机抽样表明大多数用户已尽力准确阅读句子,但未对数据进行质量分析,因此某些录音可能存在错误。
提供机构:
1rsh
原始信息汇总

Rajasthani Hindi Speech Dataset

概述

该数据集包含参与者在拉贾斯坦语(Rajasthani Hindi)中逐句朗读故事的音频记录。共有98名来自Soda, Rajasthan的参与者,每位参与者朗读了30个故事。总计有426,872条录音。参与者中大约有58名男性和40名女性。

注意: 尽管随机抽样表明大多数用户都尽力准确地朗读了句子,但我们尚未对数据进行任何质量分析。某些录音可能存在错误。

数据集结构

数据集包含两个字段:音频和句子,分别包含音频文件和相应的句子。

数据集信息

  • 语言: 拉贾斯坦语(Rajasthani Hindi)
  • 许可证: MIT
  • 大小类别: 100K<n<1M
  • 任务类别: 文本转语音、自动语音识别
  • 美观名称: Rajasthani Hindi Speech Dataset

特征

  • 音频: 音频类型
  • 句子: 字符串类型

分割

  • 训练集: 7,425,995,581.812981字节,422,603个样本
  • 测试集: 74,991,388.79801954字节,4,269个样本

下载和数据集大小

  • 下载大小: 7,504,372,330字节
  • 数据集大小: 7,500,986,970.611字节

配置

  • 默认配置:
    • 训练集路径: data/train-*
    • 测试集路径: data/test-*

标签

  • webdataset
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作