ISIC Archive Skin Lesion Dataset|皮肤病变分类数据集|模型公平性数据集
收藏数据集概述
研究目的
本研究旨在系统地检查不同卷积神经网络(CNN)架构在皮肤病变图像输入下的诊断准确性,特别关注训练数据中性别等人口统计参数的变化。
数据集构建
- 使用了一个平衡的测试集。
- 构建了五个大小相等的训练集,其中女性与男性的比例分别为:仅女性、75:25、50:50、25:75、仅男性。
- 所有六个数据集的良性与恶性比例均为50:50。
数据来源
数据集包含从ISIC档案收集的皮肤病变元数据,参考文献包括:
- Codella, N., et al. (2019)
- Codella, N.C.F., et al. (2018)
- Combalia, M., et al. (2019)
- Gutman, D., et al. (2016)
- Tschandl, P., et al. (2018)
- Veronica, R., et al. (2021)
代码结构
0_data
: 包含收集的皮肤病变元数据。1_code
: 包含基准模型和多任务模型,实验定义和MATLAB代码。single task
:0_baseline.py
(Keras和TensorFlow)reinforcing
:1_mtl_strengthen.py
(Keras和TensorFlow)adversarial
:br-net.py
(PyTorch)MATLAB folder
: 包含用于创建数据集分布的线性规划模型。Experiments folder
: 包含运行各种模型和数据集组合的实验。e1
: 50F:50M (run-e1: base, run-e1m:reinforcing, run-e1br:adversarial)e5
: 仅女性e7
: 仅男性e8
: 25F:75Me9
: 75F:25M

GME Data
关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。
github 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
PDT Dataset
PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。
arXiv 收录
MMAUD
MMAUD数据集是由南洋理工大学电气与电子工程学院创建,专注于小型无人机的检测、分类和轨迹估计。该数据集结合了多种传感器输入,包括立体视觉、多种激光雷达、雷达和音频阵列,以高保真度模拟真实世界场景。MMAUD提供了由Leica生成的精确地面实况数据,增强了数据集的可信度,并支持算法的精确和高效开发。数据集的应用领域包括无人机威胁检测、分类和轨迹估计,旨在解决现代微型无人机威胁带来的挑战。
arXiv 收录
中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录