IMed-361M|医学图像分割数据集|人工智能数据集
收藏IMIS-Benchmark 数据集概述
数据集简介
- 名称: IMed-361M
- 类型: 多模态交互式医学图像分割数据集
- 规模: 包含超过361百万个掩码
- 图像数量: 640万张
- 掩码数量: 273.4百万个(每张图像平均56个掩码)
- 成像模态: 14种
- 分割目标: 204个
- 分辨率: 83%的图像分辨率在256×256到1024×1024之间
- 多样性: 涵盖六个解剖组,大部分掩码覆盖面积小于图像的2%
数据集来源
- 创建方式: 通过预处理来自多个来源的110个医学图像数据集生成
- 公开方式: 数据集将在HuggingFace上公开
数据集结构
sh dataset ├── BTCV │ ├─ image │ │ ├── xxx.png │ │ ├── .... │ │ ├── xxx.png │ ├── label │ │ ├── xxx.npz │ │ ├── .... │ │ ├── xxx.npz │ ├── imask │ │ ├── xxx.npy │ │ ├── .... │ │ ├── xxx.npy │ └── dataset.json
相关论文
- 论文标题: Interactive Medical Image Segmentation: A Benchmark Dataset and Baseline
- 作者: Junlong Cheng, Bin Fu, Jin Ye, Guoan Wang, Tianbin Li, Haoyu Wang, Ruoyu Li, He Yao, Junren Chen, JingWen Li, Yanzhou Su, Min Zhu, Junjun He
- 年份: 2024
- arXiv链接: https://arxiv.org/abs/2411.12814

- 1Interactive Medical Image Segmentation: A Benchmark Dataset and Baseline上海人工智能实验室 · 2024年
Med-MAT
Med-MAT是一个包含106个开源医学数据集的视觉问答(VQA)数据集,旨在推动医学多模态大语言模型(MLLMs)的泛化实验和训练。数据集通过将图像-标签对转换为VQA格式,展示了组合泛化(CG)是MLLMs理解未见图像的关键机制。数据集包括106个医学数据集的问答对、53个按模态、解剖区域和任务(MAT)分类的子集的问答对,以及部分数据集的图像下载链接。
huggingface 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
LinkedIn Salary Insights Dataset
LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。
www.linkedin.com 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
OECD - Education at a Glance
该数据集提供了关于教育系统在不同国家和地区的详细统计数据,包括教育支出、教育参与率、教育成果、教师资源等多个方面。数据涵盖了OECD成员国以及部分非成员国。
www.oecd.org 收录