BrunoHays/multilingual_librispeech_fr_processed
收藏Hugging Face2023-03-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/BrunoHays/multilingual_librispeech_fr_processed
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是从Huggingface Hub的`facebook/multilingual_librispeech`数据集中处理而来,配置为法语。数据集包含音频数据、句子、路径、分类信息以及处理后的句子。数据字段包括`audio`、`sentence`、`path`、`taxonomy`、`taxonomy_large`和`sentence_processed`。数据集分为训练集和测试集,分别包含251463和2393行数据。
该数据集是从Huggingface Hub的`facebook/multilingual_librispeech`数据集中处理而来,配置为法语。数据集包含音频数据、句子、路径、分类信息以及处理后的句子。数据字段包括`audio`、`sentence`、`path`、`taxonomy`、`taxonomy_large`和`sentence_processed`。数据集分为训练集和测试集,分别包含251463和2393行数据。
提供机构:
BrunoHays
原始信息汇总
数据集概述
数据集名称
multilingual_librispeech_fr_processed
数据集来源
该数据集是从Huggingface Hub的facebook/multilingual_librispeech数据集处理而来,使用的是french配置。
数据集结构
数据字段
audio: 音频数据,包含array(音频数组)、path(文件路径)和sampling_rate(采样率)。sentence: 原始文本。path: 文件路径。taxonomy: 分类标签。taxonomy_large: 扩展分类标签。sentence_processed: 处理后的文本。
数据分割
train: 包含251463条记录。test: 包含2393条记录。
许可证信息
数据集属于Illuin Technology。



