joe-chiu/TinyChineseStories
收藏Hugging Face2023-09-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/joe-chiu/TinyChineseStories
下载链接
链接失效反馈官方服务:
资源简介:
这是一个由GPT3.5生成的中文短篇故事数据集,灵感来源于Tiny Stories数据集。数据集包含几千个故事,每个故事基于三个约束条件生成:类型、主题和句子开头。每三个故事共享相同的参数。数据集是作为使用GPT API生成训练数据的学习练习而创建的。
提供机构:
joe-chiu
原始信息汇总
数据集概述
数据集描述
- 语言: 中文
- 内容: 由GPT3.5生成的短篇中文故事集。
- 灵感来源: Tiny Stories数据集。
- 规模: 数千个故事,而非数百万行。
- 创建目的: 作为使用GPT API生成训练数据的学习练习,用于潜在的语言模型开发。
数据生成过程
- 角色名称: 使用ChatGPT生成男性与女性角色名称列表。
- 类型与主题: 生成类型和单句故事主题列表。
- 故事开头: 生成故事开头语句列表。
- 生成方法: 使用GPT3.5聊天完成API,在给定类型、主题和句子开头的约束下生成短篇故事。
- 生成批次: 每次生成3个故事,这3个故事共享相同的参数。
许可证
- 许可证类型: CC-BY-4.0



