VladS159/romanian_speech_dataset_with_50_percent_8_speakers_synthetic_data

Name: VladS159/romanian_speech_dataset_with_50_percent_8_speakers_synthetic_data
Creator: VladS159
Published: 2026-04-03 09:18:34
License: 暂无描述

Hugging Face2026-04-03 更新2026-04-12 收录

下载链接：

https://hf-mirror.com/datasets/VladS159/romanian_speech_dataset_with_50_percent_8_speakers_synthetic_data

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: audio dtype: audio: sampling_rate: 48000 - name: sentence dtype: string - name: is_synthetic dtype: bool splits: - name: train num_bytes: 11959160733.875 num_examples: 35289 - name: test num_bytes: 296319869.128 num_examples: 4432 download_size: 11393728485 dataset_size: 12255480603.003 configs: - config_name: default data_files: - split: train path: data/train-* - split: test path: data/test-* ---

数据集信息：特征字段： - 字段名：音频（audio），数据类型为音频格式，采样率为48000Hz - 字段名：句子（sentence），数据类型为字符串 - 字段名：是否合成（is_synthetic），数据类型为布尔值数据集拆分： - 拆分名称：训练集（train），占用字节数：11959160733.875，样本数量：35289 - 拆分名称：测试集（test），占用字节数：296319869.128，样本数量：4432 下载总大小：11393728485 字节数据集总大小：12255480603.003 字节配置项： - 配置名称：默认（default），数据文件配置： - 训练集拆分：对应数据路径为 data/train-* - 测试集拆分：对应数据路径为 data/test-*

提供机构：

VladS159

5,000+

优质数据集

54 个

任务类型

进入经典数据集