five

AgentEval

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/WooooDyy/AgentGym
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集提供了一个包含多种环境和任务的框架,旨在支持广泛的实时、单一格式和并发代理探索。此外,它还包含了跨环境的基准测试套件和高质量轨迹。该数据集的任务是研究基于LLM的代理在不同环境中的自我进化。

This dataset provides a framework encompassing diverse environments and tasks, aiming to support a wide range of real-time, single-format, and concurrent agent exploration. Furthermore, it includes cross-environment benchmark suites and high-quality trajectories. The core task of this dataset is to investigate the self-evolution of LLM-based agents across various environments.
提供机构:
WooooDyy
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作