ISIC Archive Skin Lesion Dataset|皮肤病变分类数据集|模型公平性数据集
收藏数据集概述
研究目的
本研究旨在系统地检查不同卷积神经网络(CNN)架构在皮肤病变图像输入下的诊断准确性,特别关注训练数据中性别等人口统计参数的变化。
数据集构建
- 使用了一个平衡的测试集。
- 构建了五个大小相等的训练集,其中女性与男性的比例分别为:仅女性、75:25、50:50、25:75、仅男性。
- 所有六个数据集的良性与恶性比例均为50:50。
数据来源
数据集包含从ISIC档案收集的皮肤病变元数据,参考文献包括:
- Codella, N., et al. (2019)
- Codella, N.C.F., et al. (2018)
- Combalia, M., et al. (2019)
- Gutman, D., et al. (2016)
- Tschandl, P., et al. (2018)
- Veronica, R., et al. (2021)
代码结构
0_data: 包含收集的皮肤病变元数据。1_code: 包含基准模型和多任务模型,实验定义和MATLAB代码。single task:0_baseline.py(Keras和TensorFlow)reinforcing:1_mtl_strengthen.py(Keras和TensorFlow)adversarial:br-net.py(PyTorch)MATLAB folder: 包含用于创建数据集分布的线性规划模型。Experiments folder: 包含运行各种模型和数据集组合的实验。e1: 50F:50M (run-e1: base, run-e1m:reinforcing, run-e1br:adversarial)e5: 仅女性e7: 仅男性e8: 25F:75Me9: 75F:25M

Wind Turbine Data
该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。
www.kaggle.com 收录
Crop Yield Prediction Dataset
Impact of Environmental Factors on Crop Yields Across Countries
kaggle 收录
波士顿房价数据集
波士顿房价数据集是一个经典的机器学习数据集,通常用于回归任务,尤其是房价预测。下方文档中有所有字段顺序的描述。
阿里云天池 收录
CMNEE(Chinese Military News Event Extraction dataset)
CMNEE(Chinese Military News Event Extraction dataset)是国防科技大学、东南大学和清华大学联合构建的一个大规模的、基于文档标注的开源中文军事新闻事件抽取数据集。该数据集包含17,000份文档和29,223个事件,所有事件均基于预定义的军事领域模式人工标注,包括8种事件类型和11种论元角色。数据集构建遵循两阶段多轮次标注策略,首先通过权威网站获取军事新闻文本并预处理,然后依据触发词字典进行预标注,经领域专家审核后形成事件模式。随后,通过人工分批、迭代标注并持续修正,直至满足既定质量标准。CMNEE作为首个专注于军事领域文档级事件抽取的数据集,对推动相关研究具有显著意义。
github 收录
era5
ERA5数据集是基于Hersbach等人的研究,包含26个气候变量,数据采样间隔为每6小时一次,覆盖了整个月份的每天,适用于气候研究。
huggingface 收录
