Excel file|机器学习数据集|模型评估数据集
收藏TCIA
TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。
www.cancerimagingarchive.net 收录
Materials Project
材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)
OpenDataLab 收录
China Health and Nutrition Survey (CHNS)
China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。
www.cpc.unc.edu 收录
neuralcatcher/hateful_memes
The Hateful Memes Challenge数据集由Facebook AI创建,专注于检测多模态表情包中的仇恨言论,旨在推动和衡量多模态推理和理解方面的进展。数据集包含多种类型的训练和测试数据,每个示例包含文本、图像路径和标签,评估使用AUROC指标。
hugging_face 收录
UAV-CD
UAV-CD数据集包含2,660对768×768像素的无人机光学图像,空间分辨率为0.06米。数据集主要涉及建筑物的增加和拆除,并进一步通过增加土地变化来丰富样本的多样性。
github 收录