babs/thorsten_de
收藏Hugging Face2024-04-24 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/babs/thorsten_de
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频和文本数据,主要用于训练模型。数据集包含四个特征:source_audio(源音频)、reference_audio(参考音频)、text(文本)和language(语言)。其中,source_audio和reference_audio是采样率为24000Hz的音频数据;text是字符串类型的文本数据;language是表示语言的字符串。数据集仅包含一个训练集(train),共有45344个样本,总大小为14437145878.016字节,下载大小为14436061881字节。
该数据集包含音频和文本数据,主要用于训练模型。数据集包含四个特征:source_audio(源音频)、reference_audio(参考音频)、text(文本)和language(语言)。其中,source_audio和reference_audio是采样率为24000Hz的音频数据;text是字符串类型的文本数据;language是表示语言的字符串。数据集仅包含一个训练集(train),共有45344个样本,总大小为14437145878.016字节,下载大小为14436061881字节。
提供机构:
babs
原始信息汇总
数据集信息
特征
- source_audio:
- 类型: 音频
- 采样率: 24000 Hz
- reference_audio:
- 类型: 音频
- 采样率: 24000 Hz
- text:
- 类型: 字符串
- language:
- 类型: 字符串
数据分割
- train:
- 字节数: 14437145878.016
- 样本数: 45344
数据集大小
- 下载大小: 14436061881 字节
- 数据集大小: 14437145878.016 字节
配置
- default:
- 数据文件:
- 分割: train
- 路径: data/train-*
- 数据文件:



