Agent-Eval-Refine/Agent-Trajectories
收藏Hugging Face2024-04-12 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/Agent-Eval-Refine/Agent-Trajectories
下载链接
链接失效反馈资源简介:
`trajectories.zip`包含了论文中评估的所有轨迹数据,包括WebArena、Android和iOS平台上的不同基线模型和人类演示的轨迹。`ios-offline-trajectories.zip`包含了CogAgent在iOS模拟器上的轨迹数据,用于通过Filtered BC优化CogAgent模型。`webarena-reflexion-<evaluator-type>.zip`包含了WebArena上的轨迹数据,用于通过模型评估器优化GPT-4 CoT基线模型。
`trajectories.zip`包含了论文中评估的所有轨迹数据,包括WebArena、Android和iOS平台上的不同基线模型和人类演示的轨迹。`ios-offline-trajectories.zip`包含了CogAgent在iOS模拟器上的轨迹数据,用于通过Filtered BC优化CogAgent模型。`webarena-reflexion-<evaluator-type>.zip`包含了WebArena上的轨迹数据,用于通过模型评估器优化GPT-4 CoT基线模型。
提供机构:
Agent-Eval-Refine
原始信息汇总
数据集概述
主要数据集文件
-
trajectories.zip
- WebArena
- GPT-4 CoT baseline agent
- Android
- Auto-UI base/large
- CogAgent
- Human demonstrations from Android-in-the-Wild
- iOS
- CogAgent baseline
- CogAgent + Self-training
- CogAgent + Filtered BC
- WebArena
-
ios-offline-trajectories.zip
- Contains CogAgents trajectories on iOS emulator, used for refining the CogAgent model through Filtered BC.
-
webarena-reflexion-<evaluator-type>.zip
- Refines the GPT-4 CoT baseline with various evaluators:
- GPT-4V
- Captioner + GPT-4
- Captioner + Mixtral
- Oracle Evaluator
- Refines the GPT-4 CoT baseline with various evaluators:
数据集用途
- The trajectories are used for evaluating and refining various AI models, particularly focusing on CogAgent and GPT-4 CoT baseline.



