five

lukasthede/WikiBigEdit

收藏
Hugging Face2025-03-13 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/lukasthede/WikiBigEdit
下载链接
链接失效反馈
官方服务:
资源简介:
WikiBigEdit是一个大规模的基准数据集,旨在评估大型语言模型在终身知识编辑方面的性能。它包含了从2024年2月至7月间Wikidata的实时编辑中提取的超过50万个问题-答案对,用于测试LLMs在事实更新、泛化、局部性和多跳推理方面的能力。

WikiBigEdit is a large-scale benchmark designed to evaluate the performance of large language models (LLMs) in lifelong knowledge editing. It consists of over 500,000 question-answer pairs extracted from real-time edits in Wikidata between February and July 2024, aiming to test LLMs capabilities in fact updating, generalization, locality, and multi-hop reasoning.
提供机构:
lukasthede
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作