five

keyuuw/gdpval-claude-opus-eval

收藏
Hugging Face2025-12-15 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/keyuuw/gdpval-claude-opus-eval
下载链接
链接失效反馈
官方服务:
资源简介:
GDPval数据集用于评估AI模型在现实世界中有经济价值的任务上的表现。包含44个职业中的220个真实世界知识任务,每个任务包括一个文本提示和一组支持性参考文件。数据集可能包含敏感内容,如NSFW内容、政治内容等,这些内容的存在是为了反映不同职业中的真实主题。

Dataset for GDPval: Evaluating AI Model Performance on Real-World Economically Valuable Tasks. 220 real-world knowledge tasks across 44 occupations. Each task consists of a text prompt and a set of supporting reference files. Some tasks include NSFW content, such as sex, alcohol, vulgar language, and political content, to reflect real themes addressed in various occupations.
提供机构:
keyuuw
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作