five

JSS Dataset (Jejueo Single Speaker Speech)

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/JSS_Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
济州岛在 2010 年被联合国教科文组织列为极度濒危物种。尽管已经做出了各种努力来振兴它,但很少有计算方法。受此启发,我们构建了两个新的 Jejueo 数据集:Jejueo 面试成绩单 (JIT) 和 Jejueo 单人演讲 (JSS)。 JIT 数据集是一个包含 170k+ Jejueo-Korean 句子的并行语料库,而 JSS 数据集由 10k 个由济州本地人录制的高质量音频文件和一个转录文件组成。随后,我们使用它们构建机器翻译和语音合成的神经系统。所有资源都可以通过我们的 GitHub 存储库公开获得。我们希望这些数据集能够吸引语言和机器学习社区的兴趣。
提供机构:
OpenDataLab
创建时间:
2022-08-16
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作