five

GPT2模型中文文本数据集

收藏
魔搭社区2025-12-01 更新2025-11-15 收录
下载链接:
https://modelscope.cn/datasets/smallzh/gpt2_model_learn_zh_text
下载链接
链接失效反馈
官方服务:
资源简介:
学习GPT-2模型用到的中文数据集

A Chinese dataset used for training the GPT-2 model
提供机构:
maas
创建时间:
2025-11-10
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是用于GPT2模型学习的中文文本数据,来源于MiniMind数据集的两个文件,经过抽取处理生成三个子文件,包含纯文本和保持原格式的样本。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务