five

Speech Accent Archive

收藏
阿里云天池2026-05-14 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/144729
下载链接
链接失效反馈
官方服务:
资源简介:
This dataset allows you to compare the demographic and linguistic backgrounds of the speakers in order to determine which variables are key predictors of each accent. The speech accent archive demonstrates that accents are systematic rather than merely mistaken speech. This dataset contains 2140 speech samples, each from a different talker reading the same reading passage. Talkers come from 177 countries and have 214 different native languages. Each talker is speaking in English.

本数据集可用于对比分析不同说话人的人口统计特征与语言背景,进而确定可作为各类口音关键预测因子的变量。该语音口音档案库(Speech Accent Archive)的研究表明,口音是具备系统性的语言现象,而非单纯的语音失误。本数据集共包含2140条语音样本,每条样本均来自一位独立的说话人,且所有说话人均朗读了同一段指定文本。这些说话人来自177个国家,母语涵盖214种不同语言,且均以英语完成朗读。
提供机构:
阿里云天池
创建时间:
2023-01-18
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Speech Accent Archive是一个英语语音数据集,包含来自177个国家和214种母语的2140个说话者朗读同一段落的语音样本。该数据集旨在通过比较说话者的背景来研究口音的系统性预测因素,适用于语言教学、研究和语音识别等领域。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作