five

多模态具身语言模型代理的跨平台代理基准

收藏
极市2025-10-16 更新2025-10-18 收录
下载链接:
https://www.cvmart.net/dataSets/detail/1346
下载链接
链接失效反馈
官方服务:
资源简介:
CRAB-Benchmark-v0 是 CRAB 框架发布的基准测试数据集,包含安卓智能手机和 Ubuntu 桌面计算机两个虚拟机环境,有 100 个任务和 59 种不同的评估函数,用于评估基于 MLM 的智能体在跨平台执行现实世界任务的性能
提供机构:
极市
二维码
社区交流群
二维码
科研交流群
商业服务