five

CALLHOME Mandarin Chinese Speech

收藏
DataCite Commons2021-07-01 更新2024-07-13 收录
下载链接:
https://catalog.ldc.upenn.edu/LDC96S34
下载链接
链接失效反馈
官方服务:
资源简介:
<h3>Introduction</h3><br> <p>The CALLHOME Mandarin Chinese corpus of telephone speech consists of 120 unscripted telephone conversations between native speakers of Mandarin Chinese. All calls, which lasted up to 30 minutes, originated in North America and were placed to locations overseas. Most participants called family members or close friends.</p><br> <h3>Data</h3><br> <p>This corpus contains speech data files only, along with documentation that describes the contents and format of the speech files and the software packages needed to uncompress the speech data. The transcripts and documentation (<a href="http://catalog.ldc.upenn.edu/LDC96T16" rel="nofollow">LDC96T16</a>) are available separately, as is an associated lexicon (<a href="http://catalog.ldc.upenn.edu/LDC96L15" rel="nofollow">LDC96L15</a>).</p><br> <h3>Samples</h3><br> <p>Please listen to this <a href="desc/addenda/LDC96S34.sph">sample</a>.</p></br> Portions © 1996 Trustees of the University of Pennsylvania

<h3>引言</h3><br> <p>CALLHOME普通话电话语音语料库(CALLHOME Mandarin Chinese corpus)收录120段汉语普通话母语使用者之间开展的非脚本化电话对话。所有通话时长最长达30分钟,发起地均为北美,呼叫目的地均为海外,多数参与者的拨打对象为家庭成员或亲密好友。</p><br> <h3>数据集内容</h3><br> <p>该语料库仅包含语音数据文件,以及用于说明语音文件内容与格式、解压语音数据所需软件包的配套文档。语音转写文本与说明文档(<a href="http://catalog.ldc.upenn.edu/LDC96T16" rel="nofollow">LDC96T16</a>)可单独获取,配套词表(<a href="http://catalog.ldc.upenn.edu/LDC96L15" rel="nofollow">LDC96L15</a>)亦同。</p><br> <h3>样例</h3><br> <p>请收听此<a href="desc/addenda/LDC96S34.sph">语音样例</a>。</p></br> 部分内容 © 1996 宾夕法尼亚大学托管会
提供机构:
Linguistic Data Consortium
创建时间:
2020-11-30
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
CALLHOME Mandarin Chinese Speech是一个普通话电话语音数据集,包含120个非脚本对话,通话时长可达30分钟,主要用于语音识别研究。数据集仅提供语音文件,转录和词典需额外获取。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作