five

东盟语料-高质量数据集

收藏
北部湾大数据交易中心2026-03-16 更新2026-03-17 收录
下载链接:
https://www.bbgdex.com:9003/newDataMall/product/detail/?id=3058&goodsCode=&zoneNo=&title=东盟语料-高质量数据集&zoneName=
下载链接
链接失效反馈
官方服务:
资源简介:
数据集模态涵盖语音和文本,内容覆盖老挝、泰国对应的中英文平行语料;老挝语ASR数据;老挝SFT、强化学习数据;柬埔寨试题数据
提供机构:
北京海天瑞声科技股份有限公司
创建时间:
2026-03-16
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个高质量的多模态语言资源库,主要涵盖东盟国家语言,包括老挝和泰国的中英文平行语料、老挝语语音识别数据,以及老挝语和柬埔寨语的特定应用数据。其特点在于结合语音和文本模态,支持多语言处理任务,并针对机器翻译、语音识别和自然语言处理优化提供了专门数据集。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作