five

BrunoHays/ESLO

收藏
Hugging Face2023-10-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/BrunoHays/ESLO
下载链接
链接失效反馈
官方服务:
资源简介:
ESLO音频数据集是一个用于自动语音识别任务的法语数据集。数据集包含不同长度的音频文件配置,如最大30秒、最大10秒和单样本(默认)。数据集的使用受Creative Commons Attribution - NonCommercial - ShareAlike 4.0 International许可证保护。数据集的原始数据包括转录文件和音频文件,依赖ffmpeg和ffmpeg-python进行处理。数据集来源于Laboratoire Ligérien de Linguistique - UMR 7270 (LLL) 2023年的研究,并在ORTOLANG平台上发布。
提供机构:
BrunoHays
原始信息汇总

ESLO音频数据集概述

数据集基本信息

  • 任务类别:自动语音识别
  • 语言:法语
  • 许可证:CC BY-NC-4.0

数据集配置

  • 配置选项
    • max30s
    • max10s
    • single_samples(默认)

数据集来源与引用

  • 作者:Eshkol-Taravella I., Baude O., Maurel D., Hriba L., Dugua C., Tellier I.
  • 出版年份:2012
  • 文献标题:Un grand corpus oral « disponible » : le corpus d’Orléans 1968-2012.
  • 出版物:Ressources linguistiques libres, TAL. Volume 52 – n° 3/2011, 17-46
  • 机构:Laboratoire Ligérien de Linguistique - UMR 7270 (LLL)
  • 数据集版本:v1
  • 数据集链接:https://hdl.handle.net/11403/eslo/v1

数据集依赖工具

  • ffmpeg:安装命令为sudo apt-get install ffmpeg
  • ffmpeg-python:安装命令为pip install ffmpeg-python
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作