five

honicky/short_childrens_stories_with_labeled_character_names

收藏
Hugging Face2024-05-06 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/honicky/short_childrens_stories_with_labeled_character_names
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个由GPT4生成的小型故事数据集,包含了故事中主要角色的标签。数据集的创建目的是为了实验DSPy和微调小型模型以提取角色信息,这是为了开发一个AI共同作者项目,帮助家长和孩子们快速互动地创作儿童故事。数据集文件loubnabnl_stories.parquet是[loubnabnl/stories_oh_children/]的一个副本,并增加了一个包含每个故事中角色的列,这些角色信息是使用gpt-3.5-turbo提取的。数据集中没有进行训练-测试-验证的划分,因为不确定哪种比例会更有用。

这是一个由GPT4生成的小型故事数据集,包含了故事中主要角色的标签。数据集的创建目的是为了实验DSPy和微调小型模型以提取角色信息,这是为了开发一个AI共同作者项目,帮助家长和孩子们快速互动地创作儿童故事。数据集文件loubnabnl_stories.parquet是[loubnabnl/stories_oh_children/]的一个副本,并增加了一个包含每个故事中角色的列,这些角色信息是使用gpt-3.5-turbo提取的。数据集中没有进行训练-测试-验证的划分,因为不确定哪种比例会更有用。
提供机构:
honicky
原始信息汇总

数据集概述

数据集名称

  • loubnabnl_stories.parquet

数据集内容

  • 包含由GPT4生成的故事集,每个故事附有主要角色名称的标签。

数据集用途

  • 用于探索DSPy,并微调小型模型以提取故事中的角色信息。
  • 作为创建AI儿童故事合作作者项目的一部分,旨在帮助家长和孩子们快速互动地创作故事。

数据集特点

  • 增加了额外的列,包含每个故事中的角色信息,这些信息通过gpt-3.5-turbo提取。

许可证

  • MIT许可证
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作