lucasmccabe-lmi/FLAN_CoT_alpaca_style
收藏Hugging Face2023-05-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lucasmccabe-lmi/FLAN_CoT_alpaca_style
下载链接
链接失效反馈官方服务:
资源简介:
我们提供了一个数据集,代表了来自FLAN的9个链式思维(推理)微调任务。应用了Alpaca风格的格式(即指令/输入/输出字段)。如果问题是多项选择题,选项会出现在输入字段中,并在指令字段末尾添加了“在提供正确答案之前,逐步解释你的推理。”这一短语。
我们提供了一个数据集,代表了来自FLAN的9个链式思维(推理)微调任务。应用了Alpaca风格的格式(即指令/输入/输出字段)。如果问题是多项选择题,选项会出现在输入字段中,并在指令字段末尾添加了“在提供正确答案之前,逐步解释你的推理。”这一短语。
提供机构:
lucasmccabe-lmi
原始信息汇总
数据集概述
数据集名称
FLAN_CoT_alpaca_style
数据集特征
- output: 字符串类型
- instruction: 字符串类型
- input: 字符串类型
数据集拆分
- train:
- 示例数量: 74771
- 数据大小: 37140971 字节
数据集大小
- 下载大小: 14062550 字节
- 数据集大小: 37140971 字节
数据集详情
- 数据集包含9个链式思维(推理)微调任务。
- 采用Alpaca格式,包括instruction/input/output字段。
- 对于多选题,选项包含在input字段中。
- 指令字段末尾添加了“Explain your reasoning step-by-step before providing the correct answer.”。
数据集统计
- 提示数量: 74771
- 使用EleutherAI/gpt-neox-20b分词器计算的令牌数: 9016176(包括instruction+input+output)



