five

Kyudan/arXiv_latex

收藏
Hugging Face2024-03-27 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/Kyudan/arXiv_latex
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为TeX data from arXiv,包含从arXiv获取的TeX格式数据,涵盖了数学、物理、统计学和计算机科学四个领域。数据集总大小为7.17M,其中数学领域数据量为4.22M,计算机科学领域为2.76M,统计学领域为0.89M,物理领域为0.78M。所有数据均为唯一数据。

该数据集名为TeX data from arXiv,包含从arXiv获取的TeX格式数据,涵盖了数学、物理、统计学和计算机科学四个领域。数据集总大小为7.17M,其中数学领域数据量为4.22M,计算机科学领域为2.76M,统计学领域为0.89M,物理领域为0.78M。所有数据均为唯一数据。
提供机构:
Kyudan
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 文本到文本生成
  • 语言: 英语
  • 数据集大小: 1M<n<10M

数据集内容

  • 来源: 使用 https://github.com/KyuDan1/TeX2Image 代码处理
  • 类别: 包含数学、物理、统计学、计算机科学四个领域

数据集细分

领域 大小
数学 4.22M
计算机科学 2.76M
统计学 0.89M
物理 0.78M
总计(唯一) 7.17M
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作