Scalable Oversight Benchmark
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/ArjunPanickssery/math_problems_debate
下载链接
链接失效反馈官方服务:
资源简介:
该数据集采用了一种基于代理分数差(ASD)度量的原则性框架,以评估人类反馈机制的有效性,该框架衡量了一种机制在多大程度上能够促进真实陈述而非欺骗。为实现这一目标,该数据集利用了Python包(SOlib),以便快速评估可扩展的监督协议。该数据集的任务是评估人工智能监督协议中的人类反馈机制。
提供机构:
Authors of the paper



