five

BrunoHays/multilingual_librispeech_fr_processed

收藏
Hugging Face2023-03-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/BrunoHays/multilingual_librispeech_fr_processed
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是从Huggingface Hub的`facebook/multilingual_librispeech`数据集中处理而来,配置为法语。数据集包含音频数据、句子、路径、分类信息以及处理后的句子。数据字段包括`audio`、`sentence`、`path`、`taxonomy`、`taxonomy_large`和`sentence_processed`。数据集分为训练集和测试集,分别包含251463和2393行数据。

该数据集是从Huggingface Hub的`facebook/multilingual_librispeech`数据集中处理而来,配置为法语。数据集包含音频数据、句子、路径、分类信息以及处理后的句子。数据字段包括`audio`、`sentence`、`path`、`taxonomy`、`taxonomy_large`和`sentence_processed`。数据集分为训练集和测试集,分别包含251463和2393行数据。
提供机构:
BrunoHays
原始信息汇总

数据集概述

数据集名称

multilingual_librispeech_fr_processed

数据集来源

该数据集是从Huggingface Hub的facebook/multilingual_librispeech数据集处理而来,使用的是french配置。

数据集结构

数据字段
  • audio: 音频数据,包含array(音频数组)、path(文件路径)和sampling_rate(采样率)。
  • sentence: 原始文本。
  • path: 文件路径。
  • taxonomy: 分类标签。
  • taxonomy_large: 扩展分类标签。
  • sentence_processed: 处理后的文本。
数据分割
  • train: 包含251463条记录。
  • test: 包含2393条记录。

许可证信息

数据集属于Illuin Technology。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作