brain-tumour-MRI-scan|医学影像数据集|肿瘤识别数据集
收藏数据集描述
该数据集包含7023张人类脑部MRI图像,分为以下4个类别:
- 胶质瘤(glioma)
- 脑膜瘤(meningioma)
- 无肿瘤(no tumor)
- 垂体瘤(pituitary)
数据集由以下三个数据集组合而成:
数据文件结构
默认配置
-
训练集(train)
- "Training/1-notumor/*.jpg"
- "Training/2-glioma/*.jpg"
- "Training/3-meningioma/*.jpg"
- "Training/4-pituitary/*.jpg"
-
测试集(test)
- "Testing/1-notumor/*.jpg"
- "Testing/2-glioma/*.jpg"
- "Testing/3-meningioma/*.jpg"
- "Testing/4-pituitary/*.jpg"
任务类别
- 图像分类(image-classification)
语言
- 英语(en)
数据集大小
- 1K<n<10K

CMNEE(Chinese Military News Event Extraction dataset)
CMNEE(Chinese Military News Event Extraction dataset)是国防科技大学、东南大学和清华大学联合构建的一个大规模的、基于文档标注的开源中文军事新闻事件抽取数据集。该数据集包含17,000份文档和29,223个事件,所有事件均基于预定义的军事领域模式人工标注,包括8种事件类型和11种论元角色。数据集构建遵循两阶段多轮次标注策略,首先通过权威网站获取军事新闻文本并预处理,然后依据触发词字典进行预标注,经领域专家审核后形成事件模式。随后,通过人工分批、迭代标注并持续修正,直至满足既定质量标准。CMNEE作为首个专注于军事领域文档级事件抽取的数据集,对推动相关研究具有显著意义。
github 收录
Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录
猫狗图像数据集
该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。
github 收录
CliMedBench
CliMedBench是一个大规模的中文医疗大语言模型评估基准,由华东师范大学等机构创建。该数据集包含33,735个问题,涵盖14个核心临床场景,主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制,确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力,解决医疗领域中模型性能评估的不足问题。
arXiv 收录
Wind Turbine Data
该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。
www.kaggle.com 收录