five

sungjun12/vlm_tsr_test_1

收藏
Hugging Face2026-04-29 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/sungjun12/vlm_tsr_test_1
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个用于视觉语言模型(VLM)表格结构识别(TSR)测试的数据集的第一部分(共四部分),主要包含韩语内容。数据集包含scene组50000~50004的样本,每个样本由三个文件组成:表格图片、包含正确HTML和元数据的JSON文件,以及用于渲染的HTML文件。该数据集用于评估和基准测试表格结构识别性能,评估指标包括基于树编辑距离的结构相似度(TEDS)、仅评估结构的TEDS-Structure,以及合并单元格预测准确度的Span Cell F1。

This is the first part (out of four) of a test dataset for Visual Language Model (VLM) Table Structure Recognition (TSR), primarily containing Korean content. The dataset includes samples from scene groups 50000~50004, with each sample consisting of three files: a table image, a JSON file containing correct HTML and metadata, and an HTML file for rendering. The dataset is used for evaluating and benchmarking table structure recognition performance, with evaluation metrics including Tree-Edit Distance-based structural similarity (TEDS), structure-only evaluation (TEDS-Structure), and Span Cell F1 for merged cell prediction accuracy.
提供机构:
sungjun12
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作