five

annamkiepura99/paragraph-diss-gen-combined

收藏
Hugging Face2025-12-15 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/annamkiepura99/paragraph-diss-gen-combined
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个学术论文数据集,包含论文的唯一标识符(corpus_id)、多种外部标识符(如ACL、ArXiv、DOI等)、标题、作者列表(包含作者ID和姓名)、出版年份、研究领域、出版物类型、摘要、章节信息(包括标题、引用的论文讨论和子章节)、引用信息(如引用标记、起始结束位置、匹配的论文ID等)以及目标段落(包含引用ID和段落内容)。数据集分为训练集,包含669,562个样本,总大小为24,437,874,936字节。

This dataset is a collection of academic papers, featuring unique identifiers (corpus_id), various external identifiers (such as ACL, ArXiv, DOI, etc.), titles, author lists (including author IDs and names), publication years, fields of study, publication types, abstracts, section information (including headers, cited paper discussions, and subsections), citation details (such as citation markers, start/end positions, matched paper IDs, etc.), and target paragraphs (including citation IDs and paragraph content). The dataset is split into a training set containing 669,562 samples, with a total size of 24,437,874,936 bytes.
提供机构:
annamkiepura99
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作