BrunoHays/ESLO
收藏Hugging Face2023-10-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/BrunoHays/ESLO
下载链接
链接失效反馈官方服务:
资源简介:
ESLO音频数据集是一个用于自动语音识别任务的法语数据集。数据集包含不同长度的音频文件配置,如最大30秒、最大10秒和单样本(默认)。数据集的使用受Creative Commons Attribution - NonCommercial - ShareAlike 4.0 International许可证保护。数据集的原始数据包括转录文件和音频文件,依赖ffmpeg和ffmpeg-python进行处理。数据集来源于Laboratoire Ligérien de Linguistique - UMR 7270 (LLL) 2023年的研究,并在ORTOLANG平台上发布。
提供机构:
BrunoHays
原始信息汇总
ESLO音频数据集概述
数据集基本信息
- 任务类别:自动语音识别
- 语言:法语
- 许可证:CC BY-NC-4.0
数据集配置
- 配置选项:
- max30s
- max10s
- single_samples(默认)
数据集来源与引用
- 作者:Eshkol-Taravella I., Baude O., Maurel D., Hriba L., Dugua C., Tellier I.
- 出版年份:2012
- 文献标题:Un grand corpus oral « disponible » : le corpus d’Orléans 1968-2012.
- 出版物:Ressources linguistiques libres, TAL. Volume 52 – n° 3/2011, 17-46
- 机构:Laboratoire Ligérien de Linguistique - UMR 7270 (LLL)
- 数据集版本:v1
- 数据集链接:https://hdl.handle.net/11403/eslo/v1
数据集依赖工具
- ffmpeg:安装命令为
sudo apt-get install ffmpeg - ffmpeg-python:安装命令为
pip install ffmpeg-python



