five

WhissleAI/Meta_STT_ZH_AIShell3

收藏
Hugging Face2025-05-03 更新2025-05-31 收录
下载链接:
https://hf-mirror.com/datasets/WhissleAI/Meta_STT_ZH_AIShell3
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个名为Meta语音识别普通话数据集(AISHELL3)的普通话语音识别数据集,包含音频文件的元数据和音频文件。数据集分为训练集、验证集和测试集,具有特定的样本数量。提供了示例样本的JSON格式,包括音频文件路径、带有元数据的转录文本和音频时长。描述了元数据的格式,包括实体、意图、年龄、性别和方言标签。使用说明指出该数据集适合用于普通话语音识别任务。

This is the Meta Speech Recognition Mandarin Dataset (AISHELL3), which is a Mandarin Chinese speech recognition dataset containing metadata and audio files. The dataset is split into training, validation, and test sets with specific sample counts. Example samples in JSON format are provided, which include the path to the audio file, transcription text with metadata, and the duration of the audio. The metadata format is described, including entities, intents, age, gender, and dialect tags. Usage notes indicate the datasets suitability for Mandarin speech recognition tasks.
提供机构:
WhissleAI
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作