macrocosm/arxiv_titles
收藏Hugging Face2023-06-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/macrocosm/arxiv_titles
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含230万篇Arxiv论文,这些论文的标题通过InstructorXL模型进行了嵌入处理。数据集的语言为英语,大小在100万到1000万之间,并使用了MIT许可证。
该数据集包含230万篇Arxiv论文,这些论文的标题通过InstructorXL模型进行了嵌入处理。数据集的语言为英语,大小在100万到1000万之间,并使用了MIT许可证。
提供机构:
macrocosm
原始信息汇总
数据集概述
数据集内容
- 包含230万篇Arxiv论文。
- 论文通过标题使用InstructorXL模型进行嵌入。
数据集规模
- 数据集大小介于100万至1000万之间。
许可信息
- 遵循MIT许可证。
语言
- 英语



