Sunbird/salt-multispeaker-nyn
收藏Hugging Face2023-12-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Sunbird/salt-multispeaker-nyn
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: ids
dtype: string
- name: texts
dtype: string
- name: audios
sequence: float32
- name: audio_languages
dtype: string
- name: are_studio
dtype: bool
- name: speaker_ids
dtype: string
- name: sample_rates
dtype: int64
splits:
- name: train
num_bytes: 2097996653
num_examples: 4812
- name: dev
num_bytes: 42040114
num_examples: 101
- name: test
num_bytes: 45063109
num_examples: 96
download_size: 1776765999
dataset_size: 2185099876
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: dev
path: data/dev-*
- split: test
path: data/test-*
---
提供机构:
Sunbird
原始信息汇总
数据集概述
数据集特征
- ids: 数据类型为字符串。
- texts: 数据类型为字符串。
- audios: 数据类型为浮点数序列。
- audio_languages: 数据类型为字符串。
- are_studio: 数据类型为布尔值。
- speaker_ids: 数据类型为字符串。
- sample_rates: 数据类型为64位整数。
数据集分割
- train: 包含4812个样本,总字节数为2097996653。
- dev: 包含101个样本,总字节数为42040114。
- test: 包含96个样本,总字节数为45063109。
数据集大小
- 下载大小: 1776765999字节。
- 数据集大小: 2185099876字节。
配置
- 默认配置:
- 训练集: 路径为
data/train-*。 - 开发集: 路径为
data/dev-*。 - 测试集: 路径为
data/test-*。
- 训练集: 路径为



