procit001/dutchdatasetWithAlphabet
收藏Hugging Face2024-06-21 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/procit001/dutchdatasetWithAlphabet
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特性,包括说话者ID、口音、文本、性别、音频、说话者姓名和标准化文本。数据集被分割为训练集,包含4783个样本,占用1029214565.427字节。下载大小为952839356字节,数据集总大小为1029214565.427字节。
The dataset includes several features such as speaker ID, accent, text, gender, audio, speaker name, and normalized text. The dataset is split into a training set containing 4783 examples, occupying 1029214565.427 bytes. The download size is 952839356 bytes, and the total dataset size is 1029214565.427 bytes.
提供机构:
procit001
原始信息汇总
数据集概述
数据集信息
- 特征:
speaker_id: 说话者ID,数据类型为字符串。accent: 口音,数据类型为字符串。text: 文本内容,数据类型为字符串。gender: 性别,数据类型为字符串。audio: 音频文件,数据类型为音频。speaker_name: 说话者姓名,数据类型为字符串。normalized_text: 标准化文本,数据类型为字符串。
数据集划分
- 训练集:
- 名称:
train - 字节数: 1029214565.427
- 样本数: 4783
- 名称:
数据集大小
- 下载大小: 952839356 字节
- 数据集总大小: 1029214565.427 字节
配置
- 配置名称:
default- 数据文件路径:
data/train-*
- 数据文件路径:



