five

LM Contamination Index

收藏
arXiv2025-09-30 收录
下载链接:
https://hitz-zentroa.github.io/lm-contamination/
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集定期更新,对一系列开放和专有模型的污染程度进行估算。此外,该指数通过零样本提示模型生成特定数据集的实例,详细说明了所需的分割和格式,以便评估语言模型中的数据污染情况。

This dataset is periodically updated to estimate data contamination levels across a range of open and proprietary models. Furthermore, this index generates instances of specific datasets by zero-shot prompting models, and specifies the required data splits and formats to facilitate the evaluation of data contamination in language models.
提供机构:
Hitz-ZentrumA
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作