five

meituan/Audio-Turing-Test-Corpus

收藏
Hugging Face2025-05-16 更新2025-05-31 收录
下载链接:
https://hf-mirror.com/datasets/meituan/Audio-Turing-Test-Corpus
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含500个文本转录样本的多维中文语音转录数据集,用于评估机器生成语音的逼真度和自然度。数据集覆盖了中英混合、副语言特征和情感、特殊字符和数字、多音字以及古典中文诗歌/散文等五个语言和风格维度,并包括用于注意力检查的104个“陷阱”转录样本。

This is a multidimensional Chinese speech transcription dataset containing 500 textual transcripts, designed to evaluate the realism and naturalness of machine-generated speech. The dataset spans five linguistic and stylistic dimensions, including Chinese-English code-switching, paralinguistic features and emotions, special characters and numerals, polyphonic characters, and classical Chinese poetry/prose, and includes 104 trap transcripts for attentiveness checks during human evaluation.
提供机构:
meituan
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作