continual-eval

Hugging Face2026-03-13 更新2026-04-23 收录

下载链接：

https://huggingface.co/datasets/ruggsea/continual-eval

下载链接

链接失效反馈

官方服务：

资源简介：

Continual Eval 是一个基于时间戳新闻文章自动生成的问答对数据集，专为持续学习评估设计。该数据集旨在评估语言模型是否能回答特定时间段事件的问题，支持随着每月新数据的到来进行持续/时间性评估。数据集包含两种配置：'simple'（单文档事实型问答）和 'multihop'（需要从两篇及以上文章中获取信息的多文档推理问答）。当前版本包含 2024 年 11 月的时间窗口数据，其中 'simple' 配置有 181 个样本，'multihop' 配置有 14 个样本，涵盖英语和土耳其语，涉及商业、政治、体育、科技和娱乐等多个领域。每个样本包含唯一标识符、问题、答案、证据文本、来源文档信息、发布日期、语言代码、时间窗口、生成模型、法官验证结果、质量评分、主题领域和种子风格来源等字段。数据集采用 MIT 许可证发布。

创建时间：

2026-03-12

5,000+

优质数据集

54 个

任务类型

进入经典数据集