MIMIC-III-rare50
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/MIMIC-III-rare50
下载链接
链接失效反馈官方服务:
资源简介:
为了在几次学习上对自动ICD编码任务进行基准测试,我们还使用原始的MIMIC-III数据集创建了rare-50代码预测。我们把这个数据集命名为MIMIC-III-rare50。在8,692种不同类型的ICD-9代码中,我们首先选择了出现次数少于10次的代码,以适合很少的镜头设置。这构成了超过90% 的原始代码。然后,我们按测试/训练比率对过滤后的代码进行排名,并选择前50名,以便测试样本可用于评估。
在此过程中,我们还手工清除了一些潜在的常见疾病。这将包括专家标记的罕见疾病词典 (Pavan等人,
2017; Wakap等人,2019)。每个标签代码 (shot) 的平均示例数约为5个。
提供机构:
OpenDataLab
创建时间:
2022-11-24
搜集汇总
数据集介绍

背景与挑战
背景概述
MIMIC-III-rare50 是基于 MIMIC-III 数据集构建的,专门用于自动 ICD 编码任务的少样本学习基准测试。它筛选了出现次数少于 10 次的 ICD-9 代码,并选取前 50 个罕见代码,每个标签平均包含约 5 个示例。该数据集由马萨诸塞大学相关分校于 2022 年发布。
以上内容由遇见数据集搜集并总结生成



