five

2173ars/finetuning_story

收藏
Hugging Face2024-07-15 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/2173ars/finetuning_story
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个小型但高质量的数据集,用于训练小型语言模型(LLMs)如何在零样本提示下生成高质量的短故事。数据集包含3列:系统提示(system prompt)、提示(prompt)和响应(response),共有49行,涵盖了各种类型和其他要求,以微调模型以产生高质量的输出。

A small but high-quality dataset to train small LLMs on how to generate high-quality short stories in zero-shot prompts. The dataset contains 3 columns: system prompt, prompt, and response, with 49 rows covering various genres and other requirements to finetune the model to give high-quality output.
提供机构:
2173ars
原始信息汇总

数据集概述

数据集信息

  • 特征:

    • 名称: prompt
    • 数据类型: string
  • 分割:

    • 名称: train
    • 字节数: 214938
    • 样本数: 49
  • 下载大小: 91910

  • 数据集大小: 214938

配置

  • 配置名称: default
    • 数据文件:
      • 分割: train
      • 路径: data/train-*

数据集描述

  • 用途: 用于训练小型语言模型生成高质量的短篇故事,支持零样本提示。
  • 实验: 在Llama 3 8b instruct模型上进行了测试,能够生成比Llama 70b更好的故事(由Gemini和GPT-4等其他流行模型评判)。
  • 列数: 3列(system prompt, prompt, response)
  • 行数: 49行,涵盖各种类型和其他要求,以微调模型生成高质量输出。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作