LuminaAI/RCL-Breast-Cancer-Biopsy-7500|乳腺癌数据集|图像分类数据集
收藏Breast Cancer Histopathological Dataset (BreakHis)
概述
该数据集包含乳腺癌组织的组织病理学图像,分为良性(benign)和恶性(malignant)两类。每个样本存储在单独的图像文件中,并按相应的类别文件夹进行组织。该数据集的结构与Lumina AI的随机对比学习(RCL)算法通过PrismRCL应用程序或API兼容。
数据集结构
数据集的组织结构如下:
Breast_Cancer_Histopathological_Dataset/ train_data/ benign/ sample_0.png sample_1.png ... malignant/ sample_0.png sample_1.png ... test_data/ benign/ sample_0.png sample_1.png ... malignant/ sample_0.png sample_1.png ...
注意:所有图像文件名在所有类别文件夹中必须是唯一的。
特征
- 图像数据:每个文件包含一张乳腺癌组织的组织病理学图像。
- 类别:有两类,每类根据组织类型(良性或恶性)分别用单独的文件夹表示。
使用方法
以下是使用PrismRCL加载数据集的示例:
C:PrismRCLPrismRCL.exe chisquared rclticks=10 boxdown=0 data=C:path oBreast_Cancer_Histopathological_Dataset rain_data testdata=C:path oBreast_Cancer_Histopathological_Dataset est_data savemodel=C:path omodelsmymodel.classify log=C:path olog_files stopwhendone
解释:
C:PrismRCLPrismRCL.exe
:分类应用程序chisquared
:训练评估方法rclticks=10
:RCL训练参数boxdown=0
:RCL训练参数data=C:path oBreast_Cancer_Histopathological_Dataset rain_data
:训练数据路径testdata=C:path oBreast_Cancer_Histopathological_Dataset est_data
:测试数据路径savemodel=C:path omodelsmymodel.classify
:保存结果模型的路径log=C:path olog_files
:日志文件路径stopwhendone
:训练完成后结束PrismRCL会话
许可证
该数据集根据知识共享署名4.0国际许可协议(Creative Commons Attribution 4.0 International License)进行许可。详细信息请参见LICENSE文件。
原始来源
该数据集最初来源于乳腺癌组织病理学数据库(BreakHis)。您可以在以下链接找到原始数据集和更多信息:
BreakHis: Breast Cancer Histopathological Database
如果在研究或应用中使用此数据集,请引用原始来源。推荐的引用格式如下:
Spanhol, F. A., Oliveira, L. S., Petitjean, C., Heutte, L. (2016). A Dataset for Breast Cancer Histopathological Image Classification. IEEE Transactions on Biomedical Engineering (TBME), 63(7):1455-1462.
此引用确保了对BreakHis数据集原始创建者的正确归属。
附加信息
数据值已准备就绪,确保与PrismRCL兼容。自2.4.0版本起,无需进行归一化处理。

Desert Knowledge Australia Solar Centre PV Power Data
该数据集包含来自澳大利亚Alice Springs的Site 7的太阳能发电数据,包括有功功率(AP,kW)、历史温度(T,℃)、相对湿度(RH,%)、全球水平辐照度(GHI,Wh/m²)和漫射水平辐照度(DHI,Wh/m²)。
github 收录
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
中国区域教育数据库
该数据集包含了中国各区域的教育统计数据,涵盖了学校数量、学生人数、教师资源、教育经费等多个方面的信息。
www.moe.gov.cn 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
VisDrone2019
VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。
github 收录