ewok-core
收藏数据集概述
名称: EWoK (Elements of World Knowledge)
版本: v1.0
描述: EWoK是一个用于评估大型语言模型(LLMs)中基本世界知识和推理能力的框架。该数据集包含4,374个项目,测试来自11个核心人类知识领域的概念。
内容:
- 最新版本的合成数据管道和代码,用于复制当前版本的
ewok-core。 - 文档和教程,支持用户扩展EWoK,包括添加自己的概念、领域等。
使用限制:
- 所有材料(代码除外)以密码保护的ZIP文件形式分发。
- 使用EWoK材料进行预训练/训练需要明确承认。
获取方式:
- 密码保护的ZIP文件的密码在TERMS OF USE文档中提供。
支持与扩展:
- 提供自动化构建,使用GNU Make。
- 支持通过命令行界面生成新的数据集变体和运行新实验。
教程与文档:
- GLOSSARY.md 和 TUTORIAL.md 提供了关于EWoK组件和如何添加新概念的详细指南。
引用信息: bibtex @article{ivanova2024elements, author = {Ivanova, Anna and Sathe, Aalok and Lipkin, Benjamin and Kumar, Unnathi and Radkani, Setayesh and Clark, Thomas H and Kauf, Carina and Hu, Jennifer and RT, Pramod and Grand, Gabriel and Paulun, Vivian and Ryskina, Maria and Akyurek, Ekin and Wilcox, Ethan and Rashid, Nafisa and Choshen, Leshem and Levy, Roger and Fedorenko, Evelina and Tenenbaum, Josh and Andreas, Jacob}, title = {Elements of World Knowledge (EWoK): A cognition-inspired framework for evaluating basic world knowledge in language models}, journal = {arXiv}, year = {2024}, }




