five

Curation Corpus

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/curationcorp/curation-corpus
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为“策展语料库”,旨在评估语言模型,其中包含了精心挑选的文本。此外,该数据集还用于评估预训练模型的表现。其所涉及的任务是语言建模。

This dataset, named "Curated Corpus", is designed to evaluate language models and contains carefully selected texts. Additionally, it is utilized to assess the performance of pretrained models, with the relevant task being language modeling.
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作