five

lama

收藏
Opencsg2024-07-19 更新2025-05-03 收录
下载链接:
https://www.opencsg.com/datasets/facebook/lama
下载链接
链接失效反馈
官方服务:
资源简介:
LAMA旨在分析语言模型,用于探测和分析预训练语言模型中包含的事实和常识知识。它基于Google_RE、TRex、Conceptnet和Squad数据集的子集,包含英文数据,规模从几百到百万级别不等。数据集中包含清洗后的文本,以及用于预测[MASK] token的带掩码句子和相关答案,部分配置还包括模板和否定模板字段。LAMA采用CC-BY 4.0授权许可,可用于文本检索和文本分类等任务,通过预测[MASK] token的准确性来评估语言模型对事实和常识信息的掌握程度。
创建时间:
2024-07-19
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作