CVPR-BiomedSegFM|生物医学图像分割数据集|3D图像处理数据集
收藏CVPR 2025竞赛:3D生物医学图像分割基础模型数据集概述
数据集基本信息
- 许可证: CC-BY-NC-SA 4.0
- 覆盖模态: CT、MR、PET、超声、显微镜
- 数据来源: 公开数据集(允许再分发)
数据内容
- 格式: NPZ文件
- 包含键值:
imgs
: 图像数据(形状: (D,H,W),强度范围: [0, 255])gts
: 真实标注(形状: (D,H,W))spacing
: 空间信息boxes
: 边界框提示(仅部分文件包含)text_prompts
: 文本提示(仅部分文件包含)
文件夹结构
3D_train_npz_all
: 完整训练集3D_train_npz_random_10percent_16G
: 随机选取的10%训练集子集3D_val_npz
: 验证集3D_val_gt
: 验证集真实标注CVPR25_TextSegFMData_with_class.json
: 文本提示文件(用于文本引导分割任务)
交互式3D分割任务说明
- 训练集: 包含
imgs
、gts
和spacing
- 验证/测试集: 不包含
gts
,可能包含boxes
- 边界框提示:
- 适用于单目标分割
- 不适用于血管(文件名含
vessel
)和多成分脑部病变(文件名含brats
)
文本引导分割任务说明
- 训练集: 提供数据集级文本提示(JSON文件)
- 验证/测试集: 每个NPZ文件包含
text_prompts
键 - 标注类型:
instance_label: 1
: 实例标注(每个标签对应一个实例)instance_label: 0
: 常见语义标注
注意事项
- 部分数据集无文本提示(训练时需排除)
- 测试案例将预处理为标准旋转
- 实例标签评估指标为F1分数

LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
BANTH
BANTH数据集是由Penta Global Limited和Islamic University of Technology合作创建的,专门用于检测和分类转写孟加拉语中的仇恨言论。该数据集包含37,350条样本,主要来源于YouTube评论,涵盖新闻与政治、人物与博客、娱乐等多个类别。数据集的创建过程包括数据抓取、过滤、清洗和多轮人工标注与验证,确保了数据的高质量和准确性。BANTH数据集的应用领域主要集中在多标签仇恨言论检测,旨在解决低资源语言中仇恨言论自动检测的挑战,并为未来的跨语言和多标签分类研究奠定基础。
arXiv 收录
China Health and Nutrition Survey (CHNS)
China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。
www.cpc.unc.edu 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录
VisDrone2019
VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。
github 收录