卢敏实验
收藏阿里云天池2026-05-23 更新2025-06-14 收录
下载链接:
https://tianchi.aliyun.com/dataset/206395
下载链接
链接失效反馈官方服务:
资源简介:
1. 如果使用阿里云天池notebook 运行
(1) 分别建立3个文件夹,gpt2-chinese-cluecorpussmall, raw_data, processed_data
(2) 将压缩包里gpt2-chinese-cluecorpussmall, raw_data等文件夹的内容,上传到对应目录
2. 运行文件edit.ipynb
1. 若在阿里云天池Notebook环境中运行本数据集
(1) 分别建立三个文件夹,命名为gpt2-chinese-cluecorpussmall、raw_data与processed_data
(2) 将压缩包内gpt2-chinese-cluecorpussmall、raw_data等文件夹的内容上传至对应的目录中
2. 运行edit.ipynb脚本文件
提供机构:
阿里云天池
创建时间:
2025-06-09
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个名为'卢敏实验'的文本生成实验项目,基于GPT-2中文模型在阿里云天池notebook环境中运行。它提供了预训练和微调所需的文件及操作指南,包括数据目录设置和运行步骤。
以上内容由遇见数据集搜集并总结生成



