five

UdyanSachdev/Multi_Language_Audio2Text

收藏
Hugging Face2024-04-20 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/UdyanSachdev/Multi_Language_Audio2Text
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由Mozilla Common Voice项目创建,包含40,571个MP3音频文件,用于训练和评估语音到文本模型,支持英语、法语和西班牙语。数据集的具体细节包括:大小为1.28 GB,持续时间为68小时录制、48小时验证,包含750个独特的声音,格式为MP3音频。

该数据集由Mozilla Common Voice项目创建,包含40,571个MP3音频文件,用于训练和评估语音到文本模型,支持英语、法语和西班牙语。数据集的具体细节包括:大小为1.28 GB,持续时间为68小时录制、48小时验证,包含750个独特的声音,格式为MP3音频。
提供机构:
UdyanSachdev
原始信息汇总

数据集概述

数据集来源

  • 创建者:Udyan Sachdev
  • 项目来源:Mozilla Common Voice(https://commonvoice.mozilla.org/en/datasets)

数据集目的

  • 用于训练和评估语音转文本模型,推动自然语言处理技术的发展。

数据集详情

  • 大小:1.28 GB
  • 包含文件:40,571个MP3音频文件
  • 总时长:68小时记录时长,48小时验证时长
  • 语言:英语、法语、西班牙语
  • 模型应用:OpenAI Whisper-large-v3
  • 音频格式:MP3
  • 独特声音数量:750个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作