five

SEACrowd/bloom_lm

收藏
Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/SEACrowd/bloom_lm
下载链接
链接失效反馈
官方服务:
资源简介:
Bloom Lm数据集是一个为自监督语言建模任务开发的数据集,涵盖了74种东南亚地区的土著语言,总数据量为21K。该数据集采用Creative Commons许可证,使用前需要接受相关确认。数据集可以通过`datasets`库或`seacrowd`库加载,适用于自监督预训练任务。

Bloom Lm数据集是一个为自监督语言建模任务开发的数据集,涵盖了74种东南亚地区的土著语言,总数据量为21K。该数据集采用Creative Commons许可证,使用前需要接受相关确认。数据集可以通过`datasets`库或`seacrowd`库加载,适用于自监督预训练任务。
提供机构:
SEACrowd
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作