five

henryholloway/LaTeX_Image_Pairs

收藏
Hugging Face2024-03-04 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/henryholloway/LaTeX_Image_Pairs
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含LaTeX表达式及其对应图像的独特集合。LaTeX表达式是从多种开源教科书中精心抓取的,确保了数据的多样性和全面性。每个LaTeX表达式与三种不同字体渲染的图像相关联,提供了丰富的资源用于机器学习的训练和评估。数据集采用parquet文件格式存储,包含LaTeX表达式和图像路径列表。此外,生成式AI技术被用于扩展数据集,确保涵盖各种LaTeX语法和结构。数据集适用于学术研究、机器学习模型训练以及对LaTeX表达式识别或生成感兴趣的人员。

该数据集包含LaTeX表达式及其对应图像的独特集合。LaTeX表达式是从多种开源教科书中精心抓取的,确保了数据的多样性和全面性。每个LaTeX表达式与三种不同字体渲染的图像相关联,提供了丰富的资源用于机器学习的训练和评估。数据集采用parquet文件格式存储,包含LaTeX表达式和图像路径列表。此外,生成式AI技术被用于扩展数据集,确保涵盖各种LaTeX语法和结构。数据集适用于学术研究、机器学习模型训练以及对LaTeX表达式识别或生成感兴趣的人员。
提供机构:
henryholloway
原始信息汇总

LaTeX Image Pairs Dataset

概述

LaTeX Image Pairs Dataset 是一个独特的数据集,包含了 LaTeX 表达式及其对应的图像。这些 LaTeX 表达式从多种开源教科书中精心筛选而来,确保了数据集的多样性和全面性。

数据内容

  • LaTeX 表达式:每个条目包含一个 LaTeX 表达式。
  • 图像路径:每个 LaTeX 表达式关联三个图像路径,这些图像展示了在三种不同字体下渲染的表达式。

数据结构

数据集以 parquet 文件格式存储,每个条目包含以下信息:

  • LaTeX 表达式
  • 三个图像路径,分别指向 Images 文件夹中的图像

数据生成

除了从教科书中筛选的原始 LaTeX 表达式外,还使用了生成式 AI 技术扩展数据集,确保涵盖广泛的 LaTeX 语法和结构。

应用场景

该数据集适用于学术研究、机器学习模型训练,以及对 LaTeX 表达式识别或生成感兴趣的开发者和研究人员。它结合了真实数据和合成数据,为 LaTeX 相关技术的研究提供了全面的工具。

许可证

该数据集采用 CC-BY-4.0 许可证。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作