SciHTC
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/SciHTC
下载链接
链接失效反馈官方服务:
资源简介:
我们从ACM数字图书馆中提供的论文中得出SciHTC。我们数据集中的论文的类别信息是根据ACM创建的名为 “ccs” 的类别层次结构树定义的。具体来说,每篇论文都分配给层次树的子分支,该分支由其各自的作者指定。除了类别信息外,scifhtc还包含每篇论文的标题,摘要和作者指定的关键字。
提供机构:
OpenDataLab
创建时间:
2022-11-18
搜集汇总
数据集介绍

背景与挑战
背景概述
SciHTC是一个基于ACM数字图书馆论文构建的数据集,包含论文的标题、摘要、作者关键词以及基于ACM 'ccs'层次树的类别信息,主要用于文本分类或自然语言处理任务。该数据集由伊利诺伊大学芝加哥分校于2022年发布,规模为3.3MB,涵盖965个文件,适用于学术研究场景。
以上内容由遇见数据集搜集并总结生成



