five

illuin/ESLO

收藏
Hugging Face2024-03-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/illuin/ESLO
下载链接
链接失效反馈
官方服务:
资源简介:
--- task_categories: - automatic-speech-recognition language: - fr license: cc-by-nc-4.0 --- ESLO audio dataset configs: - no_overlap_no_hesitation - no_hesitation - no_overlap - raw Licence Creative Commons Attribution - Pas d'Utilisation Commerciale - Partage dans les Mêmes Conditions 4.0 International Dependencies: - ffmpeg: `sudo apt-get install ffmpeg` - ffmpeg-python: `pip install ffmpeg-python` ``` {'audio': {'array': array([-0.00250244, 0.00039673, 0.00326538, ..., 0.01953125, 0.02206421, 0.02304077]), 'path': None, 'sampling_rate': 16000}, 'end_timestamp': 8.939, 'file': 'ESLO1_INTPERS_437', 'overlap': False, 'sentence': "eh bien je voudrais vous demander d'abord en quoi consiste votre " 'entreprise ici ? exactement', 'speaker': 'spk1', 'start_timestamp': 0.954} ``` Eshkol-Taravella I., Baude O., Maurel D., Hriba L., Dugua C., Tellier I., (2012), Un grand corpus oral « disponible » : le corpus d’Orléans 1968-2012., in Ressources linguistiques libres, TAL. Volume 52 – n° 3/2011, 17-46 Laboratoire Ligérien de Linguistique - UMR 7270 (LLL) (2023). ESLO [Corpus]. ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr, v1, https://hdl.handle.net/11403/eslo/v1.
提供机构:
illuin
原始信息汇总

ESLO音频数据集概述

数据集基本信息

  • 任务类别:自动语音识别
  • 语言:法语
  • 许可证:CC BY-NC-4.0

数据集配置

  • 无重叠无犹豫
  • 无犹豫
  • 无重叠
  • 原始数据

数据集来源与引用

  • 作者:Eshkol-Taravella I., Baude O., Maurel D., Hriba L., Dugua C., Tellier I.
  • 出版年份:2012
  • 论文标题:Un grand corpus oral « disponible » : le corpus d’Orléans 1968-2012.
  • 出版物:Ressources linguistiques libres, TAL. Volume 52 – n° 3/2011, 17-46
  • 机构:Laboratoire Ligérien de Linguistique - UMR 7270 (LLL)
  • 数据集版本:v1
  • 数据集链接:https://hdl.handle.net/11403/eslo/v1
  • 数据集平台:ORTOLANG (Open Resources and TOols for LANGuage) - www.ortolang.fr
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作