2173ars/finetuning_story
收藏Hugging Face2024-07-15 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/2173ars/finetuning_story
下载链接
链接失效反馈官方服务:
资源简介:
这是一个小型但高质量的数据集,用于训练小型语言模型(LLMs)如何在零样本提示下生成高质量的短故事。数据集包含3列:系统提示(system prompt)、提示(prompt)和响应(response),共有49行,涵盖了各种类型和其他要求,以微调模型以产生高质量的输出。
A small but high-quality dataset to train small LLMs on how to generate high-quality short stories in zero-shot prompts. The dataset contains 3 columns: system prompt, prompt, and response, with 49 rows covering various genres and other requirements to finetune the model to give high-quality output.
提供机构:
2173ars
原始信息汇总
数据集概述
数据集信息
-
特征:
- 名称: prompt
- 数据类型: string
-
分割:
- 名称: train
- 字节数: 214938
- 样本数: 49
-
下载大小: 91910
-
数据集大小: 214938
配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
- 数据文件:
数据集描述
- 用途: 用于训练小型语言模型生成高质量的短篇故事,支持零样本提示。
- 实验: 在Llama 3 8b instruct模型上进行了测试,能够生成比Llama 70b更好的故事(由Gemini和GPT-4等其他流行模型评判)。
- 列数: 3列(system prompt, prompt, response)
- 行数: 49行,涵盖各种类型和其他要求,以微调模型生成高质量输出。



