xz56/react-llama

Name: xz56/react-llama
Creator: xz56
Published: 2024-03-15 20:35:07
License: 暂无描述

Hugging Face2024-03-15 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/xz56/react-llama

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含3,538个使用llama2-70b（Q5_K_M量化）生成的正确ReAct轨迹。这些轨迹遵循ReAct论文中使用的格式，并通过修改自ReAct仓库的hotpotqa.ipynb文件生成。模型通过5-shot提示生成这些轨迹，提示格式包括Thought、Action和Observation步骤。数据集的特征包括id、question、correct_answer和trajectory，且仅包含训练集，大小为7,686,150字节，包含3,538个示例。

提供机构：

xz56

原始信息汇总

ReAct Llama 数据集

数据集概述

该数据集包含 3,538 条正确的 ReAct 轨迹，这些轨迹是使用 llama2-70b（Q5_K_M 量化）生成的。数据集遵循 ReAct 论文中使用的格式。ReAct 轨迹是使用 ReAct 仓库中的修改版 hotpotqa.ipynb 文件生成的。模型以 5-shot 格式提示生成这些轨迹：

解决一个问答任务，包含交替的 Thought、Action、Observation 步骤。Thought 可以推理当前情况，Action 可以是三种类型： (1) Search[entity]，搜索维基百科上的确切实体并返回第一段，如果不存在则返回类似实体。 (2) Lookup[keyword]，返回当前段落中包含关键词的下一句。 (3) Finish[answer]，返回答案并完成任务。以下是一些示例。

数据集结构

特征

id: 数据条目的唯一标识符，数据类型为 int64。
question: 问题，数据类型为 string。
correct_answer: 正确答案，数据类型为 string。
trajectory: ReAct 轨迹，数据类型为 string。

分割

train: 训练集，包含 3538 个样本，总大小为 7686150 字节。

配置

default: 默认配置，数据文件路径为 data/train-*。

语言

数据集语言为英语。

大小类别

数据集大小类别为 1K<n<10K。

5,000+

优质数据集

54 个

任务类型

进入经典数据集