SEACrowd/bloom_lm
收藏Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/SEACrowd/bloom_lm
下载链接
链接失效反馈官方服务:
资源简介:
Bloom Lm数据集是一个为自监督语言建模任务开发的数据集,涵盖了74种东南亚地区的土著语言,总数据量为21K。该数据集采用Creative Commons许可证,使用前需要接受相关确认。数据集可以通过`datasets`库或`seacrowd`库加载,适用于自监督预训练任务。
Bloom Lm数据集是一个为自监督语言建模任务开发的数据集,涵盖了74种东南亚地区的土著语言,总数据量为21K。该数据集采用Creative Commons许可证,使用前需要接受相关确认。数据集可以通过`datasets`库或`seacrowd`库加载,适用于自监督预训练任务。
提供机构:
SEACrowd



