MaartenGr/arxiv_nlp
收藏Hugging Face2024-03-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/MaartenGr/arxiv_nlp
下载链接
链接失效反馈官方服务:
资源简介:
arXiv NLP Abstracts数据集包含了1991年至2024年间ArXiv的`cs.CL`(计算与语言)类别的摘要。该数据集主要作为教学工具,用于即将出版的书籍《Hands-On Large Language Models》中关于聚类和主题建模的章节。数据集最初来源于Kaggle,并将在书籍发布前更新,以确保包含该领域的最新文章。
arXiv NLP Abstracts数据集包含了1991年至2024年间ArXiv的`cs.CL`(计算与语言)类别的摘要。该数据集主要作为教学工具,用于即将出版的书籍《Hands-On Large Language Models》中关于聚类和主题建模的章节。数据集最初来源于Kaggle,并将在书籍发布前更新,以确保包含该领域的最新文章。
提供机构:
MaartenGr
原始信息汇总
数据集概述
数据集名称
- 名称: ArXiv Abstracts
数据集内容
- 内容描述: 包含1991年至2024年间ArXiv上
cs.CL类别的摘要。
数据集用途
- 用途: 作为即将出版的《Hands-On Large Language Models》书中“聚类与主题建模”章节的教学工具。
数据集来源
- 原始数据来源: Cornell University提供的ArXiv数据集
数据集更新
- 更新计划: 在书籍发布前,将更新此子集以确保包含领域内较新的文章。
数据集许可
- 许可: MIT



