登录后查看消息通知
搜索
常见问题
消息
登录
印尼语、马来语、越南语预训练语料
收藏
数据堂
2025-11-15 收录
下载链接:
https://www.datatang.com/dataset/1953
下载链接
链接失效反馈
官方服务:
购买咨询
问题咨询
资源简介:
本数据集为东盟语种的预训练语料,包含70GB的印尼语语料、70GB的越南语语料和10GB的马来语语料,每个语种的语料均涉及社会、文化、百科、新闻等多个领域。字段清晰,领域丰富,且可根据需求扩充语种及语料规模,助力国内大模型出海。
应用场景:
提供机构:
数据堂
© 2023-2026 上海数据发展科技有限责任公司 版权所有
沪ICP备17003045号-15
沪公网安备31010402336585号
热门搜索
社区交流群
科研交流群
商业服务
数据资源
寻源服务
数据采集
标注服务
数据产品
代理销售
数据领域
凭证登记
数据产品
介绍推广