TabLeX
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/TabLeX
下载链接
链接失效反馈官方服务:
资源简介:
TabLeX 是一个包含从科学文章生成的表格图像的大规模基准数据集。 TabLeX 由两个子集组成,一个用于表格结构提取,另一个用于表格内容提取。每个表格图像都附有相应的 LATEX 源代码。为了便于开发强大的表格 IE 工具,TabLeX 包含不同纵横比和各种字体的图像。
提供机构:
OpenDataLab
创建时间:
2022-09-01
搜集汇总
数据集介绍

背景与挑战
背景概述
TabLeX是一个大规模基准数据集,包含从科学文章生成的表格图像,并附带LaTeX源代码,用于表格结构提取和内容提取。该数据集由印度理工学院于2021年发布,图像涵盖不同纵横比和字体。
以上内容由遇见数据集搜集并总结生成



