四川话方言朗读数据库
收藏苏州大数据交易所2024-03-23 更新2024-04-26 收录
下载链接:
https://jy.suzhou.com.cn/#/product-detail/736
下载链接
链接失效反馈官方服务:
资源简介:
一、基本信息 【产品名称】 四川话方言朗读数据库 【系列名称】CDT-ASR-SC_DIALECT-2022-0005 【供方名称】 苏州核数聚信息科技有限公司 【应用领域】 数字金融、数字医疗、工业互联、能源互联、智慧出行、信息技术等 【来源行业】 人工智能 【数据主题】 方言数据 【产品类型】 语音数据包 【产品描述】 该数据为四川方言朗读数据,可用于语音识别系统训练、测试、语音分析、口音研究等多种用途。 主要采集人群为:主要采集人群为:重庆、成都、乐山、南充、广元等地。 字正:98%以上。 【关键词】方言、四川话、朗读数据 二、物理信息 【更新频率】一年 【覆盖范围】 重庆、成都、乐山、南充、广元 【存储大小】 34G 【存储格式】 语音(采样率 16k Hz,采样精度是 16bit,单通道,未压缩 wav) 【底层数据维度】共有2个标签字段,分别为:语料、标注 序号 参数名称 字段名称 字段描述 示例值 1 语料 ref 音频采集语料 2 标注 lab 语音内容的实际标注结果 三、内容说明 【样例地址】https://pan.baidu.com/s/1IDaBOK2j8iaKaR1umYrHgQ?pwd=apsj 【有效时长】 300小时 【录制人数】 890人 【音频格式】 采样率 16k Hz,采样精度 16bit,单通道,未压缩 wav 【人群比例】男女比例(6:4) 【采集设备】智能手机,基于 Android 、IOS 系统的多种品牌型号手机进行录制 【录音人地域分布】重庆、成都、乐山、南充、广元 【数据字典】 序号 参数名称 显示值 描述 1 四川方言 注音 每个字词对应相应的注音,如:巴适 ba si 输出各具体字段内容及其含义说明 【数据名称】 四环方言朗读数据库 【样例数据】 序号 参数名称 字段名称 字段描述 示例值 1 角色id 角色序号 音频名第一列为角色序号 2 音频id 音频 音频名第二列为音频id,同一角色不同id 【数据条数】 291249条 四、使用案例 家电项目 1、语音识别模型训练:这批音频数据可以用于训练语音识别模型,以使产品能够准确地识别和理解四川话的语音指令和对话。通过收集大量的四川话音频数据,并使用机器学习和深度学习技术进行模型训练,可以提高语音识别的准确性和稳定性。 2、语音命令和控制:利用四川话指令音频数据,家电产品可以开发语音命令和控制功能。这意味着用户可以使用方言话与电视进行对话,并通过语音指令控制电视、音箱等的各种功能,如调整音量、切换频道、打开特定应用程序等。这种语音控制的功能提供了一种更直观和便捷的方式来操作电视。 3、语音搜索和推荐:四川餐饮、银行等客户服务可以利用这批音频数据实现语音搜索和推荐功能。用户用方言进行内容等搜索,并获得相关的结果。基于这些数据,还可以分析用户的喜好和兴趣,提供个性化的推荐内容,以改善用户的观看体验。 五、使用说明 【交付方式】:方式一:云端介质(网盘、ftp等); 【使用方式】:可直接使用; 六、使用条件 【使用目的】: 智能产品训练验证 【使用主体】: 无 【使用者资质】: 无 【时间限制】: 无 【转让限制】: 限制客户二次销售本数据库 【其它限制】: 无 七、来源描述 【来源方式】: 自行生产,300小时有效数据 【采集说明】: 音频格式 采样率16k Hz,采样精度是16bit,单通道,未压缩wav 人群比例 男女比例(6:4) 采集设备 智能手机,基于 Android、IOS 系统的多种品牌型号手机进行录制 环境 相对安静室内环境,无回声 语料领域 涵盖售车、时政、直播、课堂、餐饮 录音人地域分布 重庆、成都、乐山、南充、广元 标签 无 【敏感数据脱敏】:是 八、产品价格 购买方式 价格/计费方式 使用次数 按小时数据计算购买价格 600元/小时 不限
1. Basic Information
【Product Name】Sichuan Dialect Reading Database
【Series Name】CDT-ASR-SC_DIALECT-2022-0005
【Supplier】Suzhou Heshuju Information Technology Co., Ltd.
【Application Fields】Digital Finance, Digital Healthcare, Industrial Internet, Energy Internet, Smart Mobility, Information Technology, etc.
【Source Industry】Artificial Intelligence
【Data Theme】Dialect Data
【Product Type】Voice Data Package
【Product Description】This dataset comprises Sichuan dialect reading recordings, which can be used for multiple scenarios including speech recognition system training, testing, speech analysis, accent research and more. The main recording subjects are from Chongqing, Chengdu, Leshan, Nanchong, Guangyuan and other regions. The pronunciation accuracy rate exceeds 98%.
【Keywords】dialect, Sichuan dialect, reading data
2. Physical Information
【Update Frequency】Annually
【Coverage】Chongqing, Chengdu, Leshan, Nanchong, Guangyuan
【Storage Size】34 GB
【Storage Format】Voice (sample rate: 16 kHz, sample bit depth: 16 bit, single-channel, uncompressed WAV)
【Underlying Data Dimensions】There are 2 label fields, namely Corpus and Annotation
| No. | Parameter Name | Field Name | Field Description | Example Value |
|-----|----------------|------------|-------------------|---------------|
| 1 | Corpus | ref | Audio collection corpus | - |
| 2 | Annotation | lab | Actual annotation result of speech content | - |
3. Content Description
【Sample Address】https://pan.baidu.com/s/1IDaBOK2j8iaKaR1umYrHgQ?pwd=apsj
【Valid Duration】300 hours
【Number of Recorded Subjects】890
【Audio Format】Sample rate: 16 kHz, sample bit depth: 16 bit, single-channel, uncompressed WAV
【Population Proportion】Male-to-female ratio: 6:4
【Collection Equipment】Smartphones, recorded using multiple brand and model phones based on Android and iOS systems
【Geographical Distribution of Speakers】Chongqing, Chengdu, Leshan, Nanchong, Guangyuan
【Data Dictionary】
| No. | Parameter Name | Display Value | Description |
|-----|----------------|---------------|-------------|
| 1 | Sichuan Dialect Phonetic Transcription | Corresponding phonetic transcription for each word, e.g., 巴适 ba si | Output the content and meaning description of each specific field |
【Data Name】Sichuan Dialect Reading Database
【Sample Data】
| No. | Parameter Name | Field Name | Field Description | Example Value |
|-----|----------------|------------|-------------------|---------------|
| 1 | Role ID | Role Serial Number | The first column of the audio filename is the role serial number | - |
| 2 | Audio ID | Audio | The second column of the audio filename is the audio ID; different IDs for the same role | - |
【Number of Data Entries】291,249 entries
4. Use Cases
Home Appliance Project
1. Speech Recognition Model Training: This batch of audio data can be used to train speech recognition models, enabling products to accurately recognize and understand Sichuan dialect voice commands and conversations. By collecting a large volume of Sichuan dialect audio data and leveraging machine learning and deep learning technologies for model training, the accuracy and stability of speech recognition can be enhanced.
2. Voice Command and Control: Using Sichuan dialect command audio data, home appliance products can develop voice command and control functions. This allows users to converse with TVs in dialect and control various functions of TVs, speakers and other devices via voice commands, such as adjusting volume, switching channels, launching specific applications, etc. This voice control feature provides a more intuitive and convenient way to operate televisions.
3. Voice Search and Recommendation: Customer service in sectors such as Sichuan catering and banking can utilize this batch of audio data to implement voice search and recommendation functions. Users can search for content and other items in dialect and obtain relevant results. Based on this data, user preferences and interests can also be analyzed to deliver personalized recommended content, improving user experience.
5. Instructions for Use
【Delivery Methods】Method 1: Cloud medium (network disk, FTP, etc.);
【Usage Mode】Can be used directly;
6. Usage Conditions
【Purpose of Use】Intelligent product training and verification
【User Subject】None
【User Qualification】None
【Time Limit】None
【Transfer Restriction】Customers are prohibited from reselling this database
【Other Restrictions】None
7. Source Description
【Source Method】Self-produced, 300 hours of valid data
【Collection Instructions】
- Audio format: Sample rate: 16 kHz, sample bit depth: 16 bit, single-channel, uncompressed WAV
- Population proportion: Male-to-female ratio: 6:4
- Collection equipment: Smartphones, recorded using multiple brand and model phones based on Android and iOS systems
- Environment: Relatively quiet indoor environment, no echo
- Corpus fields: Cover car sales, current affairs, live streaming, classes, catering
- Labels: None
【Sensitive Data De-identification】Yes
8. Product Price
| Purchase Method | Price/Billing Method | Usage Times |
|-----------------|----------------------|-------------|
| Calculated by hourly data | 600 RMB/hour | Unlimited
提供机构:
苏州核数聚信息科技有限公司
创建时间:
2024-03-23
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个四川话方言朗读数据库,包含来自重庆、成都、乐山、南充、广元等地的890人录制的300小时有效语音数据,音频格式为16k Hz采样率、16bit精度、单通道未压缩wav,字正率超过98%,男女比例6:4,主要用于语音识别系统训练、测试和口音研究。数据覆盖售车、时政、直播、课堂、餐饮等多个语料领域,采集环境为相对安静室内,支持智能产品如家电项目的语音命令和控制功能开发。
以上内容由遇见数据集搜集并总结生成



