ePillID
收藏arXiv2020-09-08 更新2024-06-21 收录
下载链接:
https://github.com/usuyama/ePillID-benchmark
下载链接
链接失效反馈官方服务:
资源简介:
ePillID是由微软医疗创建的大型公开基准,专注于药片图像识别,包含13,000张图像,代表9,804个外观类别。数据集主要来源于美国国立卫生研究院的Pillbox数据集,通过专业设备在控制环境下拍摄。创建过程中,数据集面临了收集和标注的高成本及监管障碍。ePillID的应用领域主要在于医疗环境中,旨在通过图像识别技术减少药物误用和提高药物管理的准确性。
ePillID is a large-scale public benchmark developed by Microsoft Medical, focusing on pill image recognition. It contains 13,000 images representing 9,804 distinct visual appearance categories. The dataset is primarily derived from the Pillbox Dataset of the U.S. National Institutes of Health (NIH), and was captured using professional equipment in controlled environments. During its development, the dataset encountered high costs related to data collection and annotation, as well as regulatory barriers. The main application scenarios of ePillID are in medical settings, aiming to reduce medication errors and improve the accuracy of medication management through image recognition technology.
提供机构:
微软医疗
创建时间:
2020-05-29
搜集汇总
数据集介绍

构建方式
ePillID 数据集的构建依托于两个现有的 NIH 数据集,包括 NIH 挑战数据集和 NIH Pillbox 数据集。NIH 挑战数据集提供了消费者图像作为基础数据集,并扩展了来自 Pillbox 数据集的参考图像。ePillID 数据集包括 3728 张消费者图像,代表 1920 个外观类别(每种药片类型的两个侧面),以及 9804 张参考图像,代表 4902 个药片类型(每种药片类型的两个侧面)。这种构建方式旨在模拟真实世界的低样本识别场景,其中模型只能访问每个外观类别的单个参考图像,但大多数药片类型在训练过程中没有消费者图像可用。
使用方法
使用 ePillID 数据集时,首先需要将消费者图像分为 80% 的训练集和 20% 的保留集,确保药片类型在两个集合中是互斥的。训练集进一步按药片类型进行划分,以便进行 4 折交叉验证。模型在训练过程中可以访问所有 4902 个药片类型的参考图像,但大多数药片类型的消费者图像在训练期间不可用。为了评估模型在同时提供药片前后侧图像的情况下的性能,构建了双面查询,通过枚举每种药片类型的所有可能的消费者图像对。在模型性能评估方面,考虑了平均平均精度 (MAP) 和全局平均精度 (GAP) 作为指标。
背景与挑战
背景概述
在医疗保健领域,识别处方药物是一项日常任务,但许多药物外观相似,如白色圆形药片,这增加了误诊的风险。为了解决这一问题,Usuyama等人于2020年引入了ePillID数据集,这是迄今为止最大的公开药片图像识别基准数据集,由13k张图像组成,代表了9804种外观类别(每种药片类型的两面)。该数据集的创建旨在提供一个低样本量的细粒度识别设置,其中大多数外观类别只有一个参考图像。该研究的主要贡献是提供了一个新的药片识别基准,并利用现有的NIH数据集构建了ePillID数据集。该数据集对相关领域的影响在于,它提供了一个现实世界的低样本量识别设置,这对于开发实际的药片识别系统至关重要。
当前挑战
ePillID数据集面临的挑战主要包括:1)所解决的领域问题是药片图像识别,特别是在低样本量的细粒度识别设置中;2)构建过程中遇到的挑战包括从非常少的训练示例中学习表示,以及许多药片具有极其相似的外观,这增加了识别的难度。此外,现有的基准数据集要么不公开,要么规模较小,不适合开发实际的药片识别系统。因此,ePillID数据集的创建和评估对于推动低样本量细粒度识别技术的发展具有重要意义。
常用场景
经典使用场景
ePillID数据集作为目前最大的药物图像识别公共基准数据集,其经典的使用场景在于辅助医疗专业人员以及患者准确识别处方药物。由于许多药物外观相似,手动识别容易出错,ePillID为基于视觉的药物识别系统提供了丰富的数据基础,有助于提高药物识别的准确性和效率。
解决学术问题
ePillID数据集解决了低样本精细粒度识别问题。该数据集中大部分外观类只有一个参考图像,使得药物识别成为一个具有挑战性的低样本识别任务。通过引入ePillID数据集,研究人员可以在这个真实世界的低样本设置上开发药物识别系统,从而推动低样本学习在药物识别领域的应用。
实际应用
ePillID数据集的实际应用场景广泛,包括但不限于药房自动化系统、移动医疗应用、患者用药指导等。通过使用ePillID数据集训练的药物识别系统,可以提高药房工作效率,减少人为错误,同时为患者提供更加便捷的用药指导,有助于提高患者的用药安全。
数据集最近研究
最新研究方向
ePillID数据集在药物识别领域开创了一个低样本精细粒度基准,该数据集由13k张图片组成,代表了9804个外观类别(4902种药片类型的两面)。大多数外观类别只有一张参考图片,这使得它成为一个具有挑战性的低样本识别场景。研究的主要方向包括利用现有的NIH数据集构建一个低样本精细粒度识别的药物识别基准。研究人员评估了各种方法,包括标准图像分类方法和基于度量学习的方法,并发现多任务度量学习模型在低样本精细粒度识别任务中表现良好。然而,错误分析表明,这些模型仍然无法可靠地区分特别容易混淆的类别。未来的研究方向包括集成光学字符识别(OCR)模型,并进一步扩展基准以包含更多药物类型和图像。
相关研究论文
- 1ePillID Dataset: A Low-Shot Fine-Grained Benchmark for Pill Identification微软医疗 · 2020年
以上内容由遇见数据集搜集并总结生成



