five

SciHTC

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/SciHTC
下载链接
链接失效反馈
官方服务:
资源简介:
我们从ACM数字图书馆中提供的论文中得出SciHTC。我们数据集中的论文的类别信息是根据ACM创建的名为 “ccs” 的类别层次结构树定义的。具体来说,每篇论文都分配给层次树的子分支,该分支由其各自的作者指定。除了类别信息外,scifhtc还包含每篇论文的标题,摘要和作者指定的关键字。
提供机构:
OpenDataLab
创建时间:
2022-11-18
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
SciHTC是一个基于ACM数字图书馆论文构建的数据集,包含论文的标题、摘要、作者关键词以及基于ACM 'ccs'层次树的类别信息,主要用于文本分类或自然语言处理任务。该数据集由伊利诺伊大学芝加哥分校于2022年发布,规模为3.3MB,涵盖965个文件,适用于学术研究场景。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作