Pile-OpenWebText2
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Pile-OpenWebText2
下载链接
链接失效反馈官方服务:
资源简介:
Pile-OpenWebText2是EleutherAi/The Pile数据集的一部分,它是原始OpenWebTextCorpus的增强版本,是一个多样化、开源的语言建模数据集。
提供机构:
OpenDataLab
创建时间:
2023-07-18
搜集汇总
数据集介绍

背景与挑战
背景概述
Pile-OpenWebText2是EleutherAI发布的The Pile数据集子集,作为原始OpenWebTextCorpus的增强版本,提供56.8G的多样化开源文本数据,适用于语言建模和文本生成任务。
以上内容由遇见数据集搜集并总结生成



