gwenxin/pills_inside_bottles
收藏数据集卡片:Pills Inside Bottles
数据集描述
概述
数据集包含13,955张药瓶内药丸的图像,这些图像从顶部视角拍摄,并标注了20种不同的国家药品代码(NDC),每张图像都有一个唯一的图像ID。数据集被分为训练集、测试集和验证集。
数据集结构
数据实例
每个数据实例包含以下特征:image(图像)、ndc(国家药品代码)和id(图像ID)。
训练集中的一个示例: json { "image": "<PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=1284x960>", "ndc": "29159", "id": "00378-3855" }
数据字段
image:药瓶内药丸的图像ndc:国家药品代码id:唯一的图像ID
数据分割
数据集分为三个部分:训练集、验证集和测试集。各部分包含不重叠的图像及其对应的NDC和ID。
| 数据集分割 | 实例数量 | 百分比 |
|---|---|---|
| 训练集 | 8,393 | 60.1% |
| 验证集 | 2,786 | 20.0% |
| 测试集 | 2,776 | 19.9% |
数据集来源
数据由一组研究人员收集,包括Lester, C. A., Al Kontar, R., 和 Chen, Q.,他们的论文《Performance Evaluation of a Prescription Medication Image Classification Model: An Observational Cohort》发表于2022年。
数据集用途
数据集可用于训练图像分类模型,有助于自动识别药丸,提高药房配药效率并减少错误。
数据集创建
数据集的创建目的是为了训练图像分类模型,以促进药房工作。
偏差、风险和限制
原始论文的研究人员仅发布了部分数据,因此模型性能可能因训练数据不足而受到影响。
引用
bibtex @InProceedings{University of Michigan - Deep Blue Data, title = {Images of pills inside medication bottles dataset}, author = {Lester, C. A., Al Kontar, R., Chen, Q.}, year = {2022} }




