xz56/react-llama
收藏Hugging Face2024-03-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/xz56/react-llama
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含3,538个使用llama2-70b(Q5_K_M量化)生成的正确ReAct轨迹。这些轨迹遵循ReAct论文中使用的格式,并通过修改自ReAct仓库的hotpotqa.ipynb文件生成。模型通过5-shot提示生成这些轨迹,提示格式包括Thought、Action和Observation步骤。数据集的特征包括id、question、correct_answer和trajectory,且仅包含训练集,大小为7,686,150字节,包含3,538个示例。
该数据集包含3,538个使用llama2-70b(Q5_K_M量化)生成的正确ReAct轨迹。这些轨迹遵循ReAct论文中使用的格式,并通过修改自ReAct仓库的hotpotqa.ipynb文件生成。模型通过5-shot提示生成这些轨迹,提示格式包括Thought、Action和Observation步骤。数据集的特征包括id、question、correct_answer和trajectory,且仅包含训练集,大小为7,686,150字节,包含3,538个示例。
提供机构:
xz56
原始信息汇总
ReAct Llama 数据集
数据集概述
该数据集包含 3,538 条正确的 ReAct 轨迹,这些轨迹是使用 llama2-70b(Q5_K_M 量化)生成的。数据集遵循 ReAct 论文 中使用的格式。ReAct 轨迹是使用 ReAct 仓库 中的修改版 hotpotqa.ipynb 文件生成的。模型以 5-shot 格式提示生成这些轨迹:
解决一个问答任务,包含交替的 Thought、Action、Observation 步骤。Thought 可以推理当前情况,Action 可以是三种类型: (1) Search[entity],搜索维基百科上的确切实体并返回第一段,如果不存在则返回类似实体。 (2) Lookup[keyword],返回当前段落中包含关键词的下一句。 (3) Finish[answer],返回答案并完成任务。 以下是一些示例。
数据集结构
特征
- id: 数据条目的唯一标识符,数据类型为 int64。
- question: 问题,数据类型为 string。
- correct_answer: 正确答案,数据类型为 string。
- trajectory: ReAct 轨迹,数据类型为 string。
分割
- train: 训练集,包含 3538 个样本,总大小为 7686150 字节。
配置
- default: 默认配置,数据文件路径为
data/train-*。
语言
- 数据集语言为英语。
大小类别
- 数据集大小类别为 1K<n<10K。



