Phy-Q
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Phy-Q
下载链接
链接失效反馈官方服务:
资源简介:
受人类智商计算方式的启发,我们定义了反映智能体物理推理智能的物理推理商(Phy-Q 分数)。我们的评估表明,1) 所有智能体的表现都远低于人类,2) 学习智能体,即使具有良好的局部泛化能力,也难以学习潜在的物理推理规则,无法进行广泛的泛化。我们鼓励开发可以达到人类水平 Phy-Q 分数的智能代理。
提供机构:
OpenDataLab
创建时间:
2022-06-28
搜集汇总
数据集介绍

背景与挑战
背景概述
Phy-Q数据集受人类智商计算启发,定义了物理推理商(Phy-Q分数)来评估智能体的物理推理智能。评估表明,当前智能体表现远低于人类水平,且难以泛化物理推理规则。该数据集由澳大利亚国立大学于2021年发布,旨在推动达到人类水平Phy-Q分数的智能代理开发。
以上内容由遇见数据集搜集并总结生成



