Kyudan/arXiv_latex
收藏Hugging Face2024-03-27 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/Kyudan/arXiv_latex
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为TeX data from arXiv,包含从arXiv获取的TeX格式数据,涵盖了数学、物理、统计学和计算机科学四个领域。数据集总大小为7.17M,其中数学领域数据量为4.22M,计算机科学领域为2.76M,统计学领域为0.89M,物理领域为0.78M。所有数据均为唯一数据。
该数据集名为TeX data from arXiv,包含从arXiv获取的TeX格式数据,涵盖了数学、物理、统计学和计算机科学四个领域。数据集总大小为7.17M,其中数学领域数据量为4.22M,计算机科学领域为2.76M,统计学领域为0.89M,物理领域为0.78M。所有数据均为唯一数据。
提供机构:
Kyudan
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 任务类别: 文本到文本生成
- 语言: 英语
- 数据集大小: 1M<n<10M
数据集内容
- 来源: 使用
https://github.com/KyuDan1/TeX2Image代码处理 - 类别: 包含数学、物理、统计学、计算机科学四个领域
数据集细分
| 领域 | 大小 |
|---|---|
| 数学 | 4.22M |
| 计算机科学 | 2.76M |
| 统计学 | 0.89M |
| 物理 | 0.78M |
| 总计(唯一) | 7.17M |



