five

小语种自然对话数据集

收藏
北部湾大数据交易中心2025-05-14 更新2026-01-15 收录
下载链接:
https://www.bbgdex.com:9003/newDataMall/product/detail/?id=3036&goodsCode=&zoneNo=&title=小语种自然对话数据集&zoneName=
下载链接
链接失效反馈
官方服务:
资源简介:
含越南语、泰语、马来语等国自然对话语音数据,时长在200~500小时不等,标注对话文本内容、对话时间、对话人身份、性别等内容。
提供机构:
东信数聚(北京)科技有限公司
创建时间:
2025-05-14
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个专注于小语种自然对话的语音数据集,涵盖越南语、泰语、马来语等多种语言,总时长在200至500小时之间,并提供了对话文本、时间、对话人身份和性别等详细标注。它主要用于训练语音识别模型,旨在解决小语种因语料不足和语境理解困难而导致的识别准确率低和失真问题,提升模型在多语言环境下的性能。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作