five

数据堂—18小时巴西人说英语手机采集语音数据

收藏
魔搭社区2026-01-06 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/18Hours-BrazilianEnglishSpeechDataByMobilePhone
下载链接
链接失效反馈
官方服务:
资源简介:
18小时巴西人说英语手机采集语音数据是由55名巴西人参与录制,性别分布均衡。录音文本涵盖通用、交互、车载、家居等多类别,内容丰富。巴西人说英语手机采集语音数据的文本经过人工校对,准确率高。

This 18-hour English speech dataset is collected from Brazilians via mobile phones, with 55 participants enrolled and a balanced gender distribution. The transcribed content covers diverse categories including general, interactive, in-vehicle and home scenarios, featuring rich content. All transcripts of the dataset have undergone manual proofreading, ensuring high accuracy.
提供机构:
maas
创建时间:
2022-12-23
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含18小时由55位巴西人通过手机录制的英语语音数据,用于测试巴西英语语音识别模型。数据格式为16kHz单声道WAV,内容涵盖通用、交互、命令和数字类别,句子准确率不低于98%,遵循Apache 2.0许可并支持商业使用。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务