babs/german_speech_dataset

Name: babs/german_speech_dataset
Creator: babs
Published: 2024-04-24 17:44:36
License: 暂无描述

Hugging Face2024-04-24 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/babs/german_speech_dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含音频和文本数据，主要用于训练模型。数据集包括四个主要特征：源音频（source_audio）、参考音频（reference_audio）、文本（text）和语言（language）。源音频和参考音频的采样率均为24000Hz，文本和语言为字符串类型。数据集仅包含一个训练集，共有942,758个样本，总大小为638,995,068,391.954字节，下载大小为633,972,744,440字节。

提供机构：

babs

原始信息汇总

数据集概述

数据集信息

特征:
- source_audio:
  - 数据类型: 音频
  - 采样率: 24000 Hz
- reference_audio:
  - 数据类型: 音频
  - 采样率: 24000 Hz
- text:
  - 数据类型: 字符串
- language:
  - 数据类型: 字符串

数据集分割

train:
- 样本数量: 942758
- 数据大小: 638995068391.954 字节

数据集大小

下载大小: 633972744440 字节
数据集大小: 638995068391.954 字节

配置

default:
- 数据文件路径: data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集