KaniTTS-research-team/emolia_bad_good_examples
收藏Hugging Face2026-03-27 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/KaniTTS-research-team/emolia_bad_good_examples
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
- name: duration
dtype: float64
- name: speaker
dtype: string
- name: language
dtype: string
- name: dnsmos
dtype: float64
- name: phone_count
dtype: int64
- name: _id
dtype: string
- name: characters_per_second
dtype: float64
- name: wavelm_timbre_embedding
sequence: float64
- name: audio
struct:
- name: array
sequence: float64
- name: path
dtype: string
- name: sampling_rate
dtype: int64
- name: dev_id
dtype: string
- name: quality
dtype: string
splits:
- name: train
num_bytes: 226707002
num_examples: 108
download_size: 173408720
dataset_size: 226707002
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
dataset_info:
特征列表:
- 名称: 文本(text)
数据类型: string
- 名称: 时长(duration)
数据类型: float64
- 名称: 说话人(speaker)
数据类型: string
- 名称: 语言(language)
数据类型: string
- 名称: DNSMOS评分(DNSMOS)
数据类型: float64
- 名称: 音素计数(phone_count)
数据类型: int64
- 名称: 唯一标识符(_id)
数据类型: string
- 名称: 每秒字符数(characters_per_second)
数据类型: float64
- 名称: WaveLM音色嵌入(WaveLM Timbre Embedding)
数据类型: float64序列
- 名称: 音频(audio)
结构体:
- 名称: 音频数组(array)
数据类型: float64序列
- 名称: 文件路径(path)
数据类型: string
- 名称: 采样率(sampling_rate)
数据类型: int64
- 名称: 设备标识符(dev_id)
数据类型: string
- 名称: 质量标签(quality)
数据类型: string
数据拆分:
- 名称: 训练集(train)
字节数: 226707002
样本数: 108
下载大小: 173408720
数据集总大小: 226707002
configs:
- 配置名称: 默认配置(default)
数据文件:
- 拆分: 训练集(train)
路径: data/train-*
提供机构:
KaniTTS-research-team



