henryholloway/LaTeX_Image_Pairs
收藏Hugging Face2024-03-04 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/henryholloway/LaTeX_Image_Pairs
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含LaTeX表达式及其对应图像的独特集合。LaTeX表达式是从多种开源教科书中精心抓取的,确保了数据的多样性和全面性。每个LaTeX表达式与三种不同字体渲染的图像相关联,提供了丰富的资源用于机器学习的训练和评估。数据集采用parquet文件格式存储,包含LaTeX表达式和图像路径列表。此外,生成式AI技术被用于扩展数据集,确保涵盖各种LaTeX语法和结构。数据集适用于学术研究、机器学习模型训练以及对LaTeX表达式识别或生成感兴趣的人员。
该数据集包含LaTeX表达式及其对应图像的独特集合。LaTeX表达式是从多种开源教科书中精心抓取的,确保了数据的多样性和全面性。每个LaTeX表达式与三种不同字体渲染的图像相关联,提供了丰富的资源用于机器学习的训练和评估。数据集采用parquet文件格式存储,包含LaTeX表达式和图像路径列表。此外,生成式AI技术被用于扩展数据集,确保涵盖各种LaTeX语法和结构。数据集适用于学术研究、机器学习模型训练以及对LaTeX表达式识别或生成感兴趣的人员。
提供机构:
henryholloway
原始信息汇总
LaTeX Image Pairs Dataset
概述
LaTeX Image Pairs Dataset 是一个独特的数据集,包含了 LaTeX 表达式及其对应的图像。这些 LaTeX 表达式从多种开源教科书中精心筛选而来,确保了数据集的多样性和全面性。
数据内容
- LaTeX 表达式:每个条目包含一个 LaTeX 表达式。
- 图像路径:每个 LaTeX 表达式关联三个图像路径,这些图像展示了在三种不同字体下渲染的表达式。
数据结构
数据集以 parquet 文件格式存储,每个条目包含以下信息:
- LaTeX 表达式
- 三个图像路径,分别指向
Images文件夹中的图像
数据生成
除了从教科书中筛选的原始 LaTeX 表达式外,还使用了生成式 AI 技术扩展数据集,确保涵盖广泛的 LaTeX 语法和结构。
应用场景
该数据集适用于学术研究、机器学习模型训练,以及对 LaTeX 表达式识别或生成感兴趣的开发者和研究人员。它结合了真实数据和合成数据,为 LaTeX 相关技术的研究提供了全面的工具。
许可证
该数据集采用 CC-BY-4.0 许可证。



