Sunbird/salt-studio-ach
收藏Hugging Face2023-12-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Sunbird/salt-studio-ach
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: text
dtype: string
- name: audio
sequence: float32
- name: audio_language
dtype: string
- name: is_studio
dtype: bool
- name: speaker_id
dtype: string
- name: sample_rate
dtype: int64
splits:
- name: train
num_bytes: 1347657571
num_examples: 4801
- name: dev
num_bytes: 27757006
num_examples: 101
- name: test
num_bytes: 26447305
num_examples: 96
download_size: 702558860
dataset_size: 1401861882
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: dev
path: data/dev-*
- split: test
path: data/test-*
---
提供机构:
Sunbird
原始信息汇总
数据集概述
特征信息
- id: 数据类型为字符串。
- text: 数据类型为字符串。
- audio: 数据类型为浮点数序列。
- audio_language: 数据类型为字符串。
- is_studio: 数据类型为布尔值。
- speaker_id: 数据类型为字符串。
- sample_rate: 数据类型为64位整数。
数据分割
- train: 包含4801个样本,总字节数为1347657571。
- dev: 包含101个样本,总字节数为27757006。
- test: 包含96个样本,总字节数为26447305。
数据集大小
- 下载大小: 702558860字节。
- 数据集大小: 1401861882字节。
配置信息
- config_name: default
- data_files:
- train: 路径为
data/train-* - dev: 路径为
data/dev-* - test: 路径为
data/test-*
- train: 路径为
- data_files:



