five

ylacombe/mls-eng-10k-text-tags-v4

收藏
Hugging Face2024-06-10 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/ylacombe/mls-eng-10k-text-tags-v4
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: original_path dtype: string - name: begin_time dtype: float64 - name: end_time dtype: float64 - name: original_text dtype: string - name: audio_duration dtype: float64 - name: speaker_id dtype: string - name: book_id dtype: string - name: snr dtype: float32 - name: c50 dtype: float32 - name: speech_duration dtype: float64 - name: speaking_rate dtype: string - name: phonemes dtype: string - name: stoi dtype: float64 - name: si-sdr dtype: float64 - name: pesq dtype: float64 - name: gender dtype: string - name: utterance_pitch_mean dtype: float64 - name: utterance_pitch_std dtype: float64 - name: pitch dtype: string - name: noise dtype: string - name: reverberation dtype: string - name: speech_monotony dtype: string - name: sdr_noise dtype: string - name: pesq_speech_quality dtype: string - name: accent dtype: string - name: text dtype: string splits: - name: dev num_bytes: 3989956 num_examples: 3807 - name: test num_bytes: 3962544 num_examples: 3769 - name: train num_bytes: 2539287582 num_examples: 2420047 download_size: 1391498385 dataset_size: 2547240082 configs: - config_name: default data_files: - split: dev path: data/dev-* - split: test path: data/test-* - split: train path: data/train-* ---

数据集信息: 特征项: - 原始文件路径(original_path),数据类型:字符串型 - 起始时间(begin_time),数据类型:64位浮点型 - 结束时间(end_time),数据类型:64位浮点型 - 原始文本(original_text),数据类型:字符串型 - 音频时长(audio_duration),数据类型:64位浮点型 - 说话人ID(speaker_id),数据类型:字符串型 - 书籍ID(book_id),数据类型:字符串型 - 信噪比(SNR),数据类型:32位浮点型 - C50清晰度指标(c50),数据类型:32位浮点型 - 语音时长(speech_duration),数据类型:64位浮点型 - 语速(speaking_rate),数据类型:字符串型 - 音素(phonemes),数据类型:字符串型 - 短时客观可懂度(STOI),数据类型:64位浮点型 - 尺度不变源失真比(SI-SDR),数据类型:64位浮点型 - 语音质量感知评估(PESQ),数据类型:64位浮点型 - 说话人性别(gender),数据类型:字符串型 - 语句基音均值(utterance_pitch_mean),数据类型:64位浮点型 - 语句基音标准差(utterance_pitch_std),数据类型:64位浮点型 - 基音(pitch),数据类型:字符串型 - 噪声(noise),数据类型:字符串型 - 混响(reverberation),数据类型:字符串型 - 语音单调性(speech_monotony),数据类型:字符串型 - 噪声信噪失真比(sdr_noise),数据类型:字符串型 - PESQ语音质量评分(pesq_speech_quality),数据类型:字符串型 - 口音(accent),数据类型:字符串型 - 目标文本(text),数据类型:字符串型 数据划分: - 划分名称:dev(开发集),字节占用量:3989956,样本数量:3807 - 划分名称:test(测试集),字节占用量:3962544,样本数量:3769 - 划分名称:train(训练集),字节占用量:2539287582,样本数量:2420047 下载总大小:1391498385 字节 总数据集大小:2547240082 字节 配置项: - 配置名称:default(默认配置),数据文件: - 数据划分:dev(开发集),文件路径:data/dev-* - 数据划分:test(测试集),文件路径:data/test-* - 数据划分:train(训练集),文件路径:data/train-*
提供机构:
ylacombe
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作