five

xz56/react-llama

收藏
Hugging Face2024-03-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/xz56/react-llama
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含3,538个使用llama2-70b(Q5_K_M量化)生成的正确ReAct轨迹。这些轨迹遵循ReAct论文中使用的格式,并通过修改自ReAct仓库的hotpotqa.ipynb文件生成。模型通过5-shot提示生成这些轨迹,提示格式包括Thought、Action和Observation步骤。数据集的特征包括id、question、correct_answer和trajectory,且仅包含训练集,大小为7,686,150字节,包含3,538个示例。

该数据集包含3,538个使用llama2-70b(Q5_K_M量化)生成的正确ReAct轨迹。这些轨迹遵循ReAct论文中使用的格式,并通过修改自ReAct仓库的hotpotqa.ipynb文件生成。模型通过5-shot提示生成这些轨迹,提示格式包括Thought、Action和Observation步骤。数据集的特征包括id、question、correct_answer和trajectory,且仅包含训练集,大小为7,686,150字节,包含3,538个示例。
提供机构:
xz56
原始信息汇总

ReAct Llama 数据集

数据集概述

该数据集包含 3,538 条正确的 ReAct 轨迹,这些轨迹是使用 llama2-70b(Q5_K_M 量化)生成的。数据集遵循 ReAct 论文 中使用的格式。ReAct 轨迹是使用 ReAct 仓库 中的修改版 hotpotqa.ipynb 文件生成的。模型以 5-shot 格式提示生成这些轨迹:

解决一个问答任务,包含交替的 Thought、Action、Observation 步骤。Thought 可以推理当前情况,Action 可以是三种类型: (1) Search[entity],搜索维基百科上的确切实体并返回第一段,如果不存在则返回类似实体。 (2) Lookup[keyword],返回当前段落中包含关键词的下一句。 (3) Finish[answer],返回答案并完成任务。 以下是一些示例。

数据集结构

特征

  • id: 数据条目的唯一标识符,数据类型为 int64。
  • question: 问题,数据类型为 string。
  • correct_answer: 正确答案,数据类型为 string。
  • trajectory: ReAct 轨迹,数据类型为 string。

分割

  • train: 训练集,包含 3538 个样本,总大小为 7686150 字节。

配置

  • default: 默认配置,数据文件路径为 data/train-*

语言

  • 数据集语言为英语。

大小类别

  • 数据集大小类别为 1K<n<10K。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作