dolma
收藏huggingface.co2025-01-22 收录
下载链接:
https://huggingface.co/datasets/allenai/dolma
下载链接
链接失效反馈官方服务:
资源简介:
Dolma: an Open Corpus of Three Trillion Tokens for Language Model Pretraining Research
Dolma:一项针对语言模型预训练研究的三万亿Token开放语料库
提供机构:
huggingface.co



