PISCO: Intertidal: site temperature data: Gull Haven, Oregon, USA (GHVX00)
收藏MNIST数据集
数据规模 训练集:60,000 张手写数字图像(28×28 像素灰度图)及对应标签 34。 测试集:10,000 张图像与标签,用于模型评估 68。 数据来源 由美国国家标准与技术研究院(NIST)收集,50% 样本来自高中生手写,50% 来自人口普查局工作人员 48。 经 Yann LeCun 团队标准化处理,成为机器学习基准数据集 1011。
阿里云天池 收录
O*NET
O*NET(Occupational Information Network)是一个综合性的职业信息数据库,提供了关于各种职业的详细描述,包括技能要求、工作活动、知识领域、工作环境等。该数据集被广泛用于职业分析、教育和劳动力市场研究。
www.onetonline.org 收录
开源公平性干预数据集
开源公平性干预数据集由乔治梅森大学计算机科学系的研究团队创建,包含62个开源公平性干预项目。该数据集旨在帮助研究人员和从业者更好地理解和使用公平性干预工具,以提高机器学习模型的公平性。数据集涵盖了广泛的公平性干预工具,包括工具、工具包、库和框架等。该数据集的创建过程包括从GitHub上搜索和筛选公平性干预项目,并分析其可用性、兼容性、算法覆盖范围、区分因素和机器学习生命周期支持等方面。该数据集的应用领域包括医疗保健、金融和教育等领域,旨在解决机器学习模型中的偏见问题,促进公平和道德的决策。
arXiv 收录
TPTP
TPTP(Thousands of Problems for Theorem Provers)是一个包含大量逻辑问题的数据集,主要用于定理证明器的测试和评估。它包含了多种逻辑形式的问题,如一阶逻辑、高阶逻辑、命题逻辑等。
www.tptp.org 收录
EcoInvent
EcoInvent是一个生命周期评估(LCA)数据库,包含了大量产品的环境影响数据。它提供了详细的产品生命周期数据,包括原材料提取、生产、使用和废弃处理等各个阶段的环境影响信息。
www.ecoinvent.org 收录
