five

DataoceanAI/Chinese_Speech_Corpus_Incabin

收藏
Hugging Face2024-07-17 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/DataoceanAI/Chinese_Speech_Corpus_Incabin
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个中文车载语音语料库,包含了多种场景下的语音数据,如车辆控制、音乐、通用对话、地图和休闲对话等,适用于汽车领域。数据集中包含了602位发音人的语音数据,总时长为388.7小时。发音人性别比例为男性49%,女性51%,年龄覆盖15至60岁,其中约10%的发音人年龄超过45岁。发音人的口音均匀分布在中国的七大主要口音区域。

This dataset is a Chinese in-vehicle speech corpus, including various types of corpora such as vehicle control, music, general conversation, map navigation, and casual conversation scenarios. It involves 602 speakers with balanced gender distribution, a wide age range, and covers the seven major dialect regions in China. The total duration of the dataset is 388.7 hours, suitable for research and applications in the automotive field.
提供机构:
DataoceanAI
原始信息汇总

数据集概述

数据集名称

  • Chinese_Speech_Corpus_Incabin

数据集描述

  • 产品类型: 中文,阅读,桌面采集(16K)
  • 产品特点: 车内采集,多种语料类型(车辆控制、音乐、通用、地图、日常对话场景),超过100种录音场景。适用于汽车领域。
  • 发音人信息:
    • 性别: 男性49%,女性51%
    • 年龄: 发音人覆盖15-60岁年龄段,约10%超过45岁
    • 口音: 均匀分布

创建者

  • Dataocean AI

关键词

  • 🇺🇸 Region: US

数据集链接

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作