pocasrocas/recipe-gantt
收藏Hugging Face2024-01-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pocasrocas/recipe-gantt
下载链接
链接失效反馈官方服务:
资源简介:
这是一个小型数据集,包含输入食谱和输出食谱甘特图,格式为TSV,其中每列代表一个步骤,每行代表一种原料。输出TSV中的单元格如果该原料在该步骤中使用,则填充为X。该数据集用于微调特定模型,遵循特定格式以便于与多种库集成。数据集的开发过程涉及使用现有数据集和库来提取和格式化数据,并对数据质量进行了一些手动调整。局限性包括数据集的大小和由于GPT-4生成而可能存在的错误。
这是一个小型数据集,包含输入食谱和输出食谱甘特图,格式为TSV,其中每列代表一个步骤,每行代表一种原料。输出TSV中的单元格如果该原料在该步骤中使用,则填充为X。该数据集用于微调特定模型,遵循特定格式以便于与多种库集成。数据集的开发过程涉及使用现有数据集和库来提取和格式化数据,并对数据质量进行了一些手动调整。局限性包括数据集的大小和由于GPT-4生成而可能存在的错误。
提供机构:
pocasrocas
原始信息汇总
数据集概述
基本信息
- 许可证: MIT
- 任务类别: 文本生成
- 语言: 英语
- 标签: 艺术, 化学, 食物, 食谱
数据集描述
- 格式: TSV 格式,每列代表一个方法步骤,每行代表一个单独的原料。输出 TSV 文件中的单元格填充有 X 表示该原料在该步骤中使用。
- 用途: 用于微调 pocasrocas/recipe-gantt-v0.1。
- 数据格式: 遵循 alpaca 的 instruction/input/response 格式,以 .jsonl 格式共享,便于与 axolotl 等库一起使用。
开发过程
- 使用 openrecipes 数据集获取数百个食谱 URL。
- 使用 recipe-scrapers 库从食谱 URL 中提取原料和方法步骤。
- 编写自定义 GPT 助手生成所需的甘特图作为 TSV 文件。
- 对输出进行少量手动调整以提高数据质量。
限制
- 大小: 仅包含 288 个示例,因成本限制。
- 错误: 由 GPT-4 生成,存在输出错误,仅手动检查了约 30 个示例。
- 指令: 所有指令相同,因数据集较小,便于模型理解任务。



