rikeshsilwalekg/phase2datasets
收藏Hugging Face2024-06-18 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/rikeshsilwalekg/phase2datasets
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频数据及其对应的转录文本,以及输入ID、标签、输入长度和说话者嵌入等特征。数据集分为训练集,包含5054个样本,总大小为952142456.4864544字节。下载大小为979797232字节。
This dataset includes audio data and corresponding transcriptions, along with features such as input IDs, labels, input length, and speaker embeddings. The dataset is divided into a training set containing 5054 samples, with a total size of 952142456.4864544 bytes. The download size is 979797232 bytes.
提供机构:
rikeshsilwalekg
原始信息汇总
数据集概述
数据集特征
- audio:
- 数据类型: 音频
- 采样率: 16000
- transcription:
- 数据类型: 字符串
- input_ids:
- 数据类型: 整数序列 (int32)
- labels:
- 数据类型: 浮点数序列 (float32)
- input_length:
- 数据类型: 整数 (int64)
- speaker_embeddings:
- 数据类型: 浮点数序列 (float32)
数据集分割
- train:
- 样本数量: 5054
- 数据大小: 952142456.4864544 字节
数据集大小
- 下载大小: 979797232 字节
- 数据集大小: 952142456.4864544 字节
配置
- default:
- 数据文件路径: data/train-*



