GAIA 通用人工智能助手的基准数据集
收藏超神经2024-07-10 更新2024-07-13 收录
下载链接:
https://hyper.ai/cn/datasets/32828
下载链接
链接失效反馈官方服务:
资源简介:
GAIA 由 Meta 、 HuggingFace 和 AutoGPT 于 2024 年联合推出,是智能体最全面的基准测试。相关论文成果为「GAIA: a benchmark for General AI Assistants」。
GAIA基准测试由Meta、HuggingFace及AutoGPT于2024年联合推出,是面向AI智能体(AI Agent)的最全面基准测试。其配套学术论文为《GAIA: a benchmark for General AI Assistants》。
创建时间:
2024-07-10
搜集汇总
数据集介绍

背景与挑战
背景概述
GAIA是由Meta、HuggingFace和AutoGPT在2024年共同发布的基准数据集,旨在评估通用人工智能助手的能力。它包含450多个复杂问题,分为三个难度级别,涉及多模态和链式推理,目前公开测试中GPT-4-Turbo的平均成绩低于7%。
以上内容由遇见数据集搜集并总结生成



