Speech Accent Archive
收藏阿里云天池2026-05-14 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/144729
下载链接
链接失效反馈官方服务:
资源简介:
This dataset allows you to compare the demographic and linguistic backgrounds of the speakers in order to determine which variables are key predictors of each accent. The speech accent archive demonstrates that accents are systematic rather than merely mistaken speech. This dataset contains 2140 speech samples, each from a different talker reading the same reading passage. Talkers come from 177 countries and have 214 different native languages. Each talker is speaking in English.
本数据集可用于对比分析不同说话人的人口统计特征与语言背景,进而确定可作为各类口音关键预测因子的变量。该语音口音档案库(Speech Accent Archive)的研究表明,口音是具备系统性的语言现象,而非单纯的语音失误。本数据集共包含2140条语音样本,每条样本均来自一位独立的说话人,且所有说话人均朗读了同一段指定文本。这些说话人来自177个国家,母语涵盖214种不同语言,且均以英语完成朗读。
提供机构:
阿里云天池
创建时间:
2023-01-18
搜集汇总
数据集介绍

背景与挑战
背景概述
Speech Accent Archive是一个英语语音数据集,包含来自177个国家和214种母语的2140个说话者朗读同一段落的语音样本。该数据集旨在通过比较说话者的背景来研究口音的系统性预测因素,适用于语言教学、研究和语音识别等领域。
以上内容由遇见数据集搜集并总结生成



