云浮市预算收支总体情况表信息|财政预算数据集|地方政府数据集
收藏PlantVillage
在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。
OpenDataLab 收录
MNBVC
MNBVC数据集是一个超大规模的中文语料集,包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词、商品介绍、笑话、糗事、聊天记录等一切形式的纯文本中文数据。数据集不但包括主流文化,也包括各个小众文化甚至火星文的数据。
github 收录
Hospital Deterioration Dataset
这是一个高保真模拟医院队列数据集,包含10,000个模拟医院入院记录,每个记录跟踪最多72小时。数据集提供每小时的生命体征(心率、血压、呼吸频率等)和实验室数值(白细胞计数、乳酸、肌酐等),以及患者人口统计学信息和多种恶化结果标签。专门设计用于构建和基准测试早期预警系统和临床恶化风险模型的机器学习应用。
github 收录
乳腺癌患者检查结果
该数据采集来自乳腺癌随访微信小程序,共采集499例患者肿瘤分级、分期、血生化检测等指标,目的在于通过监测乳腺癌患者指标的高低对患者进行预后风险评估,通过指标的高低及时发现复发征兆并及时采取措施,同时可为复发风险提供参考。
国家人口健康科学数据中心 收录
China Kadoorie Biobank (CKB)
China Kadoorie Biobank(CKB)是一项大规模的前瞻性队列研究数据库,旨在通过长期跟踪调查收集中国人群的健康相关信息,包括生活方式、环境暴露、生物样本以及疾病发生发展情况,为慢性病的病因研究和防控策略制定提供科学依据。
www.ckbiobank.org 收录
