THUDM/AgentInstruct
收藏Hugging Face2023-10-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/THUDM/AgentInstruct
下载链接
链接失效反馈官方服务:
资源简介:
AgentInstruct数据集是一个精心策划的数据集,包含1,866个高质量交互,旨在通过任务推导和自我指导等方法增强AI代理在六个不同现实世界任务中的表现。数据集的特点包括使用ReAct方法提供详细的思想解释、涵盖六个现实世界场景、通过严格奖励过滤确保高质量、以及进行严格检查以避免数据泄漏。任务概述部分列出了每个任务的过滤轨迹数量和平均轨迹轮次。
提供机构:
THUDM
原始信息汇总
数据集概述
数据集名称
- AgentInstruct
数据集特征
- conversations
- from: 数据类型为字符串
- loss: 数据类型为布尔值
- value: 数据类型为字符串
- id: 数据类型为字符串
数据集分割
- os
- num_bytes: 660245
- num_examples: 195
- db
- num_bytes: 1436655
- num_examples: 538
- alfworld
- num_bytes: 1223363
- num_examples: 336
- webshop
- num_bytes: 1602648
- num_examples: 351
- kg
- num_bytes: 2960010
- num_examples: 324
- mind2web
- num_bytes: 159590
- num_examples: 122
数据集大小
- download_size: 1255385
- dataset_size: 8042511
语言
- en
数据集描述
- AgentInstruct 是一个包含1,866个高质量交互的数据集,旨在提升AI代理在六个不同真实世界任务中的表现。该数据集利用了创新的任务推导和自我指导方法。
任务概览
| Task | # Filt. Traj. | Avg # Filt. Traj. Turns |
|---|---|---|
| ALFWorld | 336 | 13.52 |
| WebShop | 351 | 3.68 |
| Mind2Web | 122 | 1.00 |
| Knowledge Graph | 324 | 6.04 |
| Operating System | 195 | 3.85 |
| Database | 538 | 2.06 |
| AgentInstruct | 1866 | 5.24 |
模型
-
AgentLM 模型通过在AgentInstruct数据集和ShareGPT数据集上混合训练生成。
-
模型遵循Llama-2-chat的对话格式,系统提示固定为:
You are a helpful, respectful and honest assistant.
-
7B, 13B, 和 70B 模型可在Huggingface模型库中获取。
搜集汇总
数据集介绍

背景与挑战
背景概述
AgentInstruct是一个高质量的数据集,包含1,866条交互数据,覆盖六个真实世界任务,旨在通过思维链和严格过滤方法提升AI代理的决策能力。该数据集用于训练AgentLM模型,支持多任务场景下的代理能力泛化。
以上内容由遇见数据集搜集并总结生成



