five

互联网处方图片结构化数据集合

收藏
贵州省数据知识产权登记平台2025-12-05 更新2025-12-06 收录
下载链接:
https://gzdipp.gzsis.cn:12020/noticeDetail?id=1871&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
采用“图像预处理-字段提取-数据清洗-脱敏整合”四步处理算法:首先通过图像增强、噪声去除算法优化处方图片质量,提升识别基础;其次运用基于深度学习的OCR字段提取算法,精准识别7类核心字段及图片特征信息;再通过数据格式标准化算法、重复数据剔除算法、异常值检测算法(设定字段逻辑校验规则,如处方编号编码格式校验)清洗数据;最后采用敏感信息脱敏算法(姓名替换、关键字符屏蔽)及数据关联算法,将清洗后的字段与图片校验记录、识别日志关联整合,形成结构化数据集合,全程遵循医疗数据处理的合规性与准确性要求。
提供机构:
贵阳市卫生健康投资有限公司
创建时间:
2025-12-05
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个规模为1G、每日更新的卫生行业数据集合,来源于互联网处方图片,通过图像预处理、OCR识别和数据清洗等算法转化为结构化数据。其主要应用于训练OCR模型提升处方识别效率、支持医保核验防欺诈、以及助力医疗信息化和药品监管等领域。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务