five

pocasrocas/recipe-gantt

收藏
Hugging Face2024-01-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pocasrocas/recipe-gantt
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个小型数据集,包含输入食谱和输出食谱甘特图,格式为TSV,其中每列代表一个步骤,每行代表一种原料。输出TSV中的单元格如果该原料在该步骤中使用,则填充为X。该数据集用于微调特定模型,遵循特定格式以便于与多种库集成。数据集的开发过程涉及使用现有数据集和库来提取和格式化数据,并对数据质量进行了一些手动调整。局限性包括数据集的大小和由于GPT-4生成而可能存在的错误。

这是一个小型数据集,包含输入食谱和输出食谱甘特图,格式为TSV,其中每列代表一个步骤,每行代表一种原料。输出TSV中的单元格如果该原料在该步骤中使用,则填充为X。该数据集用于微调特定模型,遵循特定格式以便于与多种库集成。数据集的开发过程涉及使用现有数据集和库来提取和格式化数据,并对数据质量进行了一些手动调整。局限性包括数据集的大小和由于GPT-4生成而可能存在的错误。
提供机构:
pocasrocas
原始信息汇总

数据集概述

基本信息

  • 许可证: MIT
  • 任务类别: 文本生成
  • 语言: 英语
  • 标签: 艺术, 化学, 食物, 食谱

数据集描述

  • 格式: TSV 格式,每列代表一个方法步骤,每行代表一个单独的原料。输出 TSV 文件中的单元格填充有 X 表示该原料在该步骤中使用。
  • 用途: 用于微调 pocasrocas/recipe-gantt-v0.1
  • 数据格式: 遵循 alpaca 的 instruction/input/response 格式,以 .jsonl 格式共享,便于与 axolotl 等库一起使用。

开发过程

  1. 使用 openrecipes 数据集获取数百个食谱 URL。
  2. 使用 recipe-scrapers 库从食谱 URL 中提取原料和方法步骤。
  3. 编写自定义 GPT 助手生成所需的甘特图作为 TSV 文件。
  4. 对输出进行少量手动调整以提高数据质量。

限制

  • 大小: 仅包含 288 个示例,因成本限制。
  • 错误: 由 GPT-4 生成,存在输出错误,仅手动检查了约 30 个示例。
  • 指令: 所有指令相同,因数据集较小,便于模型理解任务。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作