five

NEWTON

收藏
arXiv2025-09-30 收录
下载链接:
https://newtonreasoning.github.io
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为NEWTON,它是一个用于评估大型语言模型(LLM)物理推理能力的资料库和基准测试工具。它包含了2800个对象-属性对以及16万个问答问题。此外,NEWTON为研究人员提供了特定领域的适应性调整,并以结构化的方式评估语言模型在理解、应用和分析物理属性方面的能力。该数据集的规模包括2800个对象-属性对和16万个问答问题,其任务旨在评估LLM的物理推理能力。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作