标题生成数据集
收藏国家基础学科公共科学数据中心2024-03-05 收录
下载链接:
https://www.nbsdc.cn/general/dataDetail?id=64edfd3ebb16e0300cd4e4a2&type=1
下载链接
链接失效反馈官方服务:
资源简介:
标题生成数据集主要面向核心词修正的编目标题生成方法研究、服务内容资源自动编目技术集成工具技术需求构建,检索并采集自百度学术与Google学术,涉及领域为工程技术、计算机和图书情报等,数据内容为中文期刊论文元数据,主要包含数据项为标题、关键词、摘要,数据量111881篇。
This title generation dataset is primarily developed for two core objectives: research on cataloging title generation methods with core term correction, and the construction of technical requirements for integrated tools for automatic cataloging technologies of service content resources. It is retrieved and collected from Baidu Scholar and Google Scholar, covering disciplines including engineering technology, computer science, and library and information science. The dataset comprises metadata of Chinese journal articles, with its main data items including title, keywords, and abstract. The total number of articles in the dataset is 111,881.
提供机构:
武汉大学
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个用于核心词修正的编目标题生成方法研究的中文期刊论文元数据集合,包含111881篇论文的标题、关键词和摘要,主要服务于自动编目技术集成工具的开发。数据来源于百度学术与Google学术,覆盖工程技术、计算机和图书情报等领域,由武汉大学于2023年发布,数据量为35.32MB。
以上内容由遇见数据集搜集并总结生成



