UdyanSachdev/Multi_Language_Audio2Text
收藏Hugging Face2024-04-20 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/UdyanSachdev/Multi_Language_Audio2Text
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由Mozilla Common Voice项目创建,包含40,571个MP3音频文件,用于训练和评估语音到文本模型,支持英语、法语和西班牙语。数据集的具体细节包括:大小为1.28 GB,持续时间为68小时录制、48小时验证,包含750个独特的声音,格式为MP3音频。
该数据集由Mozilla Common Voice项目创建,包含40,571个MP3音频文件,用于训练和评估语音到文本模型,支持英语、法语和西班牙语。数据集的具体细节包括:大小为1.28 GB,持续时间为68小时录制、48小时验证,包含750个独特的声音,格式为MP3音频。
提供机构:
UdyanSachdev
原始信息汇总
数据集概述
数据集来源
- 创建者:Udyan Sachdev
- 项目来源:Mozilla Common Voice(https://commonvoice.mozilla.org/en/datasets)
数据集目的
- 用于训练和评估语音转文本模型,推动自然语言处理技术的发展。
数据集详情
- 大小:1.28 GB
- 包含文件:40,571个MP3音频文件
- 总时长:68小时记录时长,48小时验证时长
- 语言:英语、法语、西班牙语
- 模型应用:OpenAI Whisper-large-v3
- 音频格式:MP3
- 独特声音数量:750个



