GPT2模型中文文本数据集
收藏魔搭社区2025-12-01 更新2025-11-15 收录
下载链接:
https://modelscope.cn/datasets/smallzh/gpt2_model_learn_zh_text
下载链接
链接失效反馈官方服务:
资源简介:
学习GPT-2模型用到的中文数据集
A Chinese dataset used for training the GPT-2 model
提供机构:
maas
创建时间:
2025-11-10
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是用于GPT2模型学习的中文文本数据,来源于MiniMind数据集的两个文件,经过抽取处理生成三个子文件,包含纯文本和保持原格式的样本。
以上内容由遇见数据集搜集并总结生成



