five

polygraf-ai/arXiv-abstracts

收藏
Hugging Face2025-03-27 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/polygraf-ai/arXiv-abstracts
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个包含论文或文章元数据的信息集,其中包括id, 提交者(submitter), 作者(authors), 标题(title), 评论(comments), 刊物参考(journal-ref), doi, 报告编号(report-no), 分类(categories), 许可(license), 摘要(abstract), 版本信息(versions), 更新日期(update_date), 解析后的作者列表(authors_parsed), 首个版本创建日期(first_version_created), 首个版本的日期时间戳(first_version_dt), 主要分类(top_categories)等字段。数据集的训练集大小为520,365个样本,总数据大小约为880,645,054.86字节。

This dataset is a collection of metadata from papers or articles, including fields such as id, submitter, authors, title, comments, journal-ref, doi, report-no, categories, license, abstract, versions, update_date, parsed authors list, date of creation of the first version, timestamp of the first version, and top categories. The training set of the dataset contains 520,365 samples, and the total dataset size is approximately 880,645,054.86 bytes.
提供机构:
polygraf-ai
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作