llama_poem
收藏阿里云天池2026-05-15 更新2025-09-27 收录
下载链接:
https://tianchi.aliyun.com/dataset/211368
下载链接
链接失效反馈官方服务:
资源简介:
大模型微调任务,使用的预训练模型是llama3的中文预训练模型,模型参数为7B。
微调任务为唐诗续写,即给出五言或七言的两句,让模型接出下面两句。
数据集为唐诗数据集,.json文件,包含train和test两个文件,验证集从train中划分。
This is a large language model fine-tuning task. The pre-trained model adopted is the Chinese pre-trained variant of Llama 3, with a parameter scale of 7B. The fine-tuning task is Tang poetry continuation: given two consecutive lines of five-character or seven-character Tang poetry, the model is required to generate the following two lines. The dataset is a Tang Poetry dataset stored in .json format, containing two files: train and test. The validation set is split from the training set.
提供机构:
阿里云天池
创建时间:
2025-09-25
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集用于基于llama3 7B中文预训练模型的唐诗续写微调任务,要求模型根据给定的五言或七言诗句接出后两句。数据集包含唐诗的.json格式文件,分为训练集和测试集,其中验证集从训练集中划分。
以上内容由遇见数据集搜集并总结生成



