five

Jejueo Interview Transcripts (JIT) and Jejueo Single Speaker Speech (JSS)|濒危语言保护数据集|机器翻译数据集

收藏
arXiv2019-11-27 更新2024-06-21 收录
下载链接:
https://github.com/kakaobrain/jejueo
下载链接
链接失效反馈
资源简介:
Jejueo Interview Transcripts (JIT)和Jejueo Single Speaker Speech (JSS)是针对韩国济州岛的濒危语言Jejueo构建的两个新数据集。JIT是一个包含超过170,000条Jejueo-Korean平行句子的语料库,而JSS则由10,000个高质量的音频文件及其转录文件组成。这些数据集旨在支持机器翻译和语音合成研究,特别是针对低资源语言的挑战。通过GitHub公开发布,这些数据集有望吸引语言学和机器学习社区的广泛关注。
提供机构:
Kakao Brain
创建时间:
2019-11-27
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作