数据堂—261小时日语手机采集语音数据
收藏魔搭社区2025-07-05 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/261Hours_JapaneseSpeechDataByMobilePhone
下载链接
链接失效反馈官方服务:
资源简介:
261小时日语手机采集语音数据是由1006名日本母语发音人参与录制,覆盖东部、西部、九州地区,其中东部地区占比最多。261小时日语手机采集语音数据录音内容丰富,所有文本均经过人工转写,准确率高
The 261-hour Japanese speech dataset collected via mobile phones was recorded by 1006 native Japanese speakers, covering the eastern, western, and Kyushu regions of Japan, with the eastern region accounting for the largest proportion. This dataset features rich recording content, and all transcriptions were manually conducted with high accuracy.
提供机构:
maas
创建时间:
2024-05-06
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含261小时通过手机采集的日语语音数据,由1006名日本母语者录制,覆盖东部、西部和九州地区,主要用于评估日语语音识别模型。录音内容为常见句子,数据格式为16kHz未压缩WAV,转录准确率不低于98%,由数据堂拥有版权并作为商业数据集提供。
以上内容由遇见数据集搜集并总结生成



