five

continual-eval

收藏
Hugging Face2026-03-13 更新2026-04-23 收录
下载链接:
https://huggingface.co/datasets/ruggsea/continual-eval
下载链接
链接失效反馈
官方服务:
资源简介:
Continual Eval 是一个基于时间戳新闻文章自动生成的问答对数据集,专为持续学习评估设计。该数据集旨在评估语言模型是否能回答特定时间段事件的问题,支持随着每月新数据的到来进行持续/时间性评估。数据集包含两种配置:'simple'(单文档事实型问答)和 'multihop'(需要从两篇及以上文章中获取信息的多文档推理问答)。当前版本包含 2024 年 11 月的时间窗口数据,其中 'simple' 配置有 181 个样本,'multihop' 配置有 14 个样本,涵盖英语和土耳其语,涉及商业、政治、体育、科技和娱乐等多个领域。每个样本包含唯一标识符、问题、答案、证据文本、来源文档信息、发布日期、语言代码、时间窗口、生成模型、法官验证结果、质量评分、主题领域和种子风格来源等字段。数据集采用 MIT 许可证发布。
创建时间:
2026-03-12
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作