ylacombe/mls-eng-10k-text-tags-v4
收藏Hugging Face2024-06-10 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/ylacombe/mls-eng-10k-text-tags-v4
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: original_path
dtype: string
- name: begin_time
dtype: float64
- name: end_time
dtype: float64
- name: original_text
dtype: string
- name: audio_duration
dtype: float64
- name: speaker_id
dtype: string
- name: book_id
dtype: string
- name: snr
dtype: float32
- name: c50
dtype: float32
- name: speech_duration
dtype: float64
- name: speaking_rate
dtype: string
- name: phonemes
dtype: string
- name: stoi
dtype: float64
- name: si-sdr
dtype: float64
- name: pesq
dtype: float64
- name: gender
dtype: string
- name: utterance_pitch_mean
dtype: float64
- name: utterance_pitch_std
dtype: float64
- name: pitch
dtype: string
- name: noise
dtype: string
- name: reverberation
dtype: string
- name: speech_monotony
dtype: string
- name: sdr_noise
dtype: string
- name: pesq_speech_quality
dtype: string
- name: accent
dtype: string
- name: text
dtype: string
splits:
- name: dev
num_bytes: 3989956
num_examples: 3807
- name: test
num_bytes: 3962544
num_examples: 3769
- name: train
num_bytes: 2539287582
num_examples: 2420047
download_size: 1391498385
dataset_size: 2547240082
configs:
- config_name: default
data_files:
- split: dev
path: data/dev-*
- split: test
path: data/test-*
- split: train
path: data/train-*
---
数据集信息:
特征项:
- 原始文件路径(original_path),数据类型:字符串型
- 起始时间(begin_time),数据类型:64位浮点型
- 结束时间(end_time),数据类型:64位浮点型
- 原始文本(original_text),数据类型:字符串型
- 音频时长(audio_duration),数据类型:64位浮点型
- 说话人ID(speaker_id),数据类型:字符串型
- 书籍ID(book_id),数据类型:字符串型
- 信噪比(SNR),数据类型:32位浮点型
- C50清晰度指标(c50),数据类型:32位浮点型
- 语音时长(speech_duration),数据类型:64位浮点型
- 语速(speaking_rate),数据类型:字符串型
- 音素(phonemes),数据类型:字符串型
- 短时客观可懂度(STOI),数据类型:64位浮点型
- 尺度不变源失真比(SI-SDR),数据类型:64位浮点型
- 语音质量感知评估(PESQ),数据类型:64位浮点型
- 说话人性别(gender),数据类型:字符串型
- 语句基音均值(utterance_pitch_mean),数据类型:64位浮点型
- 语句基音标准差(utterance_pitch_std),数据类型:64位浮点型
- 基音(pitch),数据类型:字符串型
- 噪声(noise),数据类型:字符串型
- 混响(reverberation),数据类型:字符串型
- 语音单调性(speech_monotony),数据类型:字符串型
- 噪声信噪失真比(sdr_noise),数据类型:字符串型
- PESQ语音质量评分(pesq_speech_quality),数据类型:字符串型
- 口音(accent),数据类型:字符串型
- 目标文本(text),数据类型:字符串型
数据划分:
- 划分名称:dev(开发集),字节占用量:3989956,样本数量:3807
- 划分名称:test(测试集),字节占用量:3962544,样本数量:3769
- 划分名称:train(训练集),字节占用量:2539287582,样本数量:2420047
下载总大小:1391498385 字节
总数据集大小:2547240082 字节
配置项:
- 配置名称:default(默认配置),数据文件:
- 数据划分:dev(开发集),文件路径:data/dev-*
- 数据划分:test(测试集),文件路径:data/test-*
- 数据划分:train(训练集),文件路径:data/train-*
提供机构:
ylacombe



