five

joe-chiu/TinyChineseStories

收藏
Hugging Face2023-09-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/joe-chiu/TinyChineseStories
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个由GPT3.5生成的中文短篇故事数据集,灵感来源于Tiny Stories数据集。数据集包含几千个故事,每个故事基于三个约束条件生成:类型、主题和句子开头。每三个故事共享相同的参数。数据集是作为使用GPT API生成训练数据的学习练习而创建的。
提供机构:
joe-chiu
原始信息汇总

数据集概述

数据集描述

  • 语言: 中文
  • 内容: 由GPT3.5生成的短篇中文故事集。
  • 灵感来源: Tiny Stories数据集。
  • 规模: 数千个故事,而非数百万行。
  • 创建目的: 作为使用GPT API生成训练数据的学习练习,用于潜在的语言模型开发。

数据生成过程

  • 角色名称: 使用ChatGPT生成男性与女性角色名称列表。
  • 类型与主题: 生成类型和单句故事主题列表。
  • 故事开头: 生成故事开头语句列表。
  • 生成方法: 使用GPT3.5聊天完成API,在给定类型、主题和句子开头的约束下生成短篇故事。
  • 生成批次: 每次生成3个故事,这3个故事共享相同的参数。

许可证

  • 许可证类型: CC-BY-4.0
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作