1aurent/LC25000|图像分类数据集|癌症研究数据集
收藏LC25000: Lung and Colon Histopathological Image Dataset
数据集描述
-
特征:
image
: 图像数据organ
: 器官分类,包括lung
(肺)和colon
(结肠)label
: 病理分类,包括benign
(良性)、adenocarcinomas
(腺癌)和squamous carcinomas
(鳞状细胞癌)
-
分割:
train
: 训练集,包含 25000 个样本,大小为 1581800190 字节
-
数据集大小:
- 下载大小: 1125348716 字节
- 数据集大小: 1581800190 字节
-
标签:
biology
,cancer
-
大小分类:
10K<n<100K
-
许可证:
unlicense
-
任务分类:
image-classification
-
Papers with Code ID:
lc25000
详细描述
该数据集包含 25,000 张彩色图像,分为 5 个类别,每个类别 5,000 张图像。所有图像大小为 768 x 768 像素,格式为 jpeg。
引用
bibtex @misc{borkowski2019lung, title = {Lung and Colon Cancer Histopathological Image Dataset (LC25000)}, author = {Andrew A. Borkowski and Marilyn M. Bui and L. Brannon Thomas and Catherine P. Wilson and Lauren A. DeLand and Stephen M. Mastorides}, year = {2019}, eprint = {1912.12142}, archiveprefix = {arXiv}, primaryclass = {eess.IV} }

学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
VisDrone2019
VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。
github 收录
RadDet
RadDet是一个包含11种雷达类别的数据集,包括6种新的低概率干扰(LPI)多相码(P1, P2, P3, P4, Px, Zadoff-Chu)和一种新的宽带调频连续波(FMCW)。数据集覆盖500 MHz频段,包含40,000个雷达帧,分为训练集、验证集和测试集。数据集在两种不同的雷达环境中提供:稀疏数据集(RadDet-1T)和密集数据集(RadDet-9T)。
github 收录