five

llama_poem

收藏
阿里云天池2026-05-15 更新2025-09-27 收录
下载链接:
https://tianchi.aliyun.com/dataset/211368
下载链接
链接失效反馈
官方服务:
资源简介:
大模型微调任务,使用的预训练模型是llama3的中文预训练模型,模型参数为7B。 微调任务为唐诗续写,即给出五言或七言的两句,让模型接出下面两句。 数据集为唐诗数据集,.json文件,包含train和test两个文件,验证集从train中划分。

This is a large language model fine-tuning task. The pre-trained model adopted is the Chinese pre-trained variant of Llama 3, with a parameter scale of 7B. The fine-tuning task is Tang poetry continuation: given two consecutive lines of five-character or seven-character Tang poetry, the model is required to generate the following two lines. The dataset is a Tang Poetry dataset stored in .json format, containing two files: train and test. The validation set is split from the training set.
提供机构:
阿里云天池
创建时间:
2025-09-25
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集用于基于llama3 7B中文预训练模型的唐诗续写微调任务,要求模型根据给定的五言或七言诗句接出后两句。数据集包含唐诗的.json格式文件,分为训练集和测试集,其中验证集从训练集中划分。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作