five

数据堂—799小时四川方言自然对话手机采集语音数据

收藏
魔搭社区2026-05-23 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/799Hours-SichuanDialectConversationalSpeechDataByMobilePhone
下载链接
链接失效反馈
官方服务:
资源简介:
799小时四川方言自然对话手机采集语音数据由1730名四川本土人参与录制,以自然方式进行面对面交流,不限制话题进行自由发挥,领域广泛,语音自然流利,符合实际对话场景。800小时四川方言自然对话手机采集语音数据由人工转写文本,准确率高。

799-hour mobile-collected speech data of natural Sichuan dialect dialogues were recorded by 1730 native Sichuan residents through natural face-to-face interactions, with no topic restrictions and free spontaneous discussions, covering a wide range of domains. The collected speeches are natural and fluent, which conform to real-world dialogue scenarios. Additionally, 800-hour mobile-collected speech data of natural Sichuan dialect dialogues have been manually transcribed into text with high accuracy.
提供机构:
maas
创建时间:
2022-12-23
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含通过手机采集的799小时四川方言自然对话语音数据,由1730名四川或重庆籍母语者参与录制,其中74%为女性、88%年龄在25岁以下,录音内容为自由对话且无主题限制。数据格式为16kHz、16位单声道WAV文件,已进行人工转写,句子准确率不低于95%,主要用于测试'四川方言语音识别模型'。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务