CSL
收藏Opencsg2024-03-21 更新2024-06-22 收录
下载链接:
https://www.opencsg.com/datasets/billionaire/CSL
下载链接
链接失效反馈官方服务:
资源简介:
CSL 数据包含 2010-2020 年发表的中文核心期刊论文元信息(标题、摘要、关键词、学科和门类),用于构建多种NLP任务。 本项目设计了16个instructions包含文本生成、关键词提取、文本摘要和文本分类等任务。
The CSL dataset contains metadata (title, abstract, keywords, subject and category) of papers published in Chinese core journals from 2010 to 2020, which is used to construct various NLP tasks. This project designs 16 instructions covering tasks including text generation, keyword extraction, text summarization and text classification.
创建时间:
2024-03-21
搜集汇总
数据集介绍

背景与挑战
背景概述
CSL是一个包含396,209篇中文核心期刊论文元信息的大规模数据集,涵盖2010-2020年的文献,支持多种NLP任务,如文本摘要、关键词生成和文本分类。数据集还提供了16个instructions,便于构建和评估不同任务。
以上内容由遇见数据集搜集并总结生成



