中文医疗化验单数据集(Chinese Medical Laboratory Dataset)
收藏阿里云天池2026-06-09 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/126039
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由北京交通大学李清勇教授团队收集并人工标注的一个医疗化验单图像数据集,包含了238张文档图像,每张图像包括两个表格。第一个表格将患者信息排列成5行4列。第二个表格报告了具体的检测信息,包含了n(n ≥ 1)行和6列。第二个表格中的一些单元格是空单元格,不包含任何内容。数据集中不包含跨行或夸列的单元格,表格行数和列数的最大值分为25和6。训练集有372个表格,验证集有104个表格。
This medical laboratory test sheet image dataset was collected and manually annotated by the team led by Professor Qingyong Li from Beijing Jiaotong University. It contains 238 document images, each including two tables. The first table arranges patient information in a 5-row and 4-column format. The second table reports specific test information, with n (n ≥ 1) rows and 6 columns. Some cells in the second table are empty and contain no content. No cells in the dataset span multiple rows or columns, and the maximum numbers of rows and columns for tables are 25 and 6 respectively. The training set includes 372 tables, while the validation set contains 104 tables.
提供机构:
阿里云天池
创建时间:
2022-04-12
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个中文医疗化验单图像数据集,由北京交通大学团队收集并标注,包含238张图像,每张图像有两个表格(患者信息和检测信息),适用于表格识别和医疗文档分析任务。数据集结构简单,无跨行或跨列单元格,训练集和验证集分别包含372个和104个表格,支持医疗AI应用开发。
以上内容由遇见数据集搜集并总结生成



