five

THUDM/AgentInstruct

收藏
Hugging Face2023-10-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/THUDM/AgentInstruct
下载链接
链接失效反馈
官方服务:
资源简介:
AgentInstruct数据集是一个精心策划的数据集,包含1,866个高质量交互,旨在通过任务推导和自我指导等方法增强AI代理在六个不同现实世界任务中的表现。数据集的特点包括使用ReAct方法提供详细的思想解释、涵盖六个现实世界场景、通过严格奖励过滤确保高质量、以及进行严格检查以避免数据泄漏。任务概述部分列出了每个任务的过滤轨迹数量和平均轨迹轮次。
提供机构:
THUDM
原始信息汇总

数据集概述

数据集名称

  • AgentInstruct

数据集特征

  • conversations
    • from: 数据类型为字符串
    • loss: 数据类型为布尔值
    • value: 数据类型为字符串
  • id: 数据类型为字符串

数据集分割

  • os
    • num_bytes: 660245
    • num_examples: 195
  • db
    • num_bytes: 1436655
    • num_examples: 538
  • alfworld
    • num_bytes: 1223363
    • num_examples: 336
  • webshop
    • num_bytes: 1602648
    • num_examples: 351
  • kg
    • num_bytes: 2960010
    • num_examples: 324
  • mind2web
    • num_bytes: 159590
    • num_examples: 122

数据集大小

  • download_size: 1255385
  • dataset_size: 8042511

语言

  • en

数据集描述

  • AgentInstruct 是一个包含1,866个高质量交互的数据集,旨在提升AI代理在六个不同真实世界任务中的表现。该数据集利用了创新的任务推导和自我指导方法。

任务概览

Task # Filt. Traj. Avg # Filt. Traj. Turns
ALFWorld 336 13.52
WebShop 351 3.68
Mind2Web 122 1.00
Knowledge Graph 324 6.04
Operating System 195 3.85
Database 538 2.06
AgentInstruct 1866 5.24

模型

  • AgentLM 模型通过在AgentInstruct数据集和ShareGPT数据集上混合训练生成。

  • 模型遵循Llama-2-chat的对话格式,系统提示固定为:

    You are a helpful, respectful and honest assistant.

  • 7B, 13B, 和 70B 模型可在Huggingface模型库中获取。

搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
AgentInstruct是一个高质量的数据集,包含1,866条交互数据,覆盖六个真实世界任务,旨在通过思维链和严格过滤方法提升AI代理的决策能力。该数据集用于训练AgentLM模型,支持多任务场景下的代理能力泛化。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作