five

CREAK

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/CREAK
下载链接
链接失效反馈
官方服务:
资源简介:
我们介绍了 CREAK,一个关于实体知识的常识推理测试平台,将关于实体的事实检查(哈利波特是一个巫师,擅长骑扫帚)与常识推理(如果你擅长一项技能,你可以教别人如何去做吧)。我们的数据集包含 13k 个人类撰写的关于实体的真实或虚假的英语声明,以及一个小的对比集。群众工作者可以很容易地提出这些陈述,并且人类在数据集上的表现很高(高 90 年代);我们认为,预训练的语言模型(LMs)应该能够融合实体知识和常识推理来在这里做得很好。在我们的实验中,我们专注于闭卷设置,并观察到在现有事实验证基准上微调的基线模型与 CREAK 中的推理类型相冲突。在 CREAK 上训练模型可大幅提高准确性,但仍达不到人类的表现。我们的基准测试提供了对自然语言理解模型的独特探索,测试了它检索事实的能力(例如,谁在芝加哥大学任教?)和未陈述的常识知识(例如,管家不会对客人大喊大叫)。
提供机构:
OpenDataLab
创建时间:
2022-05-23
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作