UCI Machine Learning Repository: Glass Identification Data Set|玻璃分类数据集|化学成分分析数据集
收藏
- UCI Machine Learning Repository首次发布Glass Identification Data Set,该数据集由B. German创建,用于玻璃分类研究。
- Glass Identification Data Set首次应用于机器学习研究,特别是在模式识别和分类算法中。
- 该数据集被广泛用于教育和研究领域,成为机器学习入门课程中的经典案例。
- 随着机器学习技术的发展,Glass Identification Data Set被用于评估和比较不同算法的性能。
- 该数据集在深度学习兴起后,被用于验证和改进深度学习模型在分类任务中的表现。
- Glass Identification Data Set继续被用作基准数据集,用于评估新型机器学习算法的有效性。
- 1Glass Identification Data SetUCI Machine Learning Repository · 1989年
- 2A Comparative Study of Machine Learning Algorithms for Glass IdentificationIEEE · 2020年
- 3Feature Selection and Classification Techniques for Glass IdentificationElsevier · 2018年
- 4Deep Learning Approaches for Glass Identification Using UCI DatasetSpringer · 2019年
- 5An Ensemble Learning Approach for Glass Identification DatasetTaylor & Francis · 2021年
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
Tropicos
Tropicos是一个全球植物名称数据库,包含超过130万种植物的名称、分类信息、分布数据、图像和参考文献。该数据库由密苏里植物园维护,旨在为植物学家、生态学家和相关领域的研究人员提供全面的植物信息。
www.tropicos.org 收录
人民日报语料库 (1998.1)
本库主要提供用于NER任务的处理好的语料,包括基于词级和字级任务的NER数据。数据集包含19484个以行为粒度切分的句子,句子长度最大为659,平均长度为57.55666187641141。实体标注采用BIO格式,区分人名、地名和机构团体。
github 收录
jpft/danbooru2023
Danbooru2023是一个大规模的动漫图像数据集,包含超过500万张由爱好者社区贡献并详细标注的图像。图像标签涵盖角色、场景、版权、艺术家等方面,平均每张图像有30个标签。该数据集可用于训练图像分类、多标签标注、角色检测、生成模型等多种计算机视觉任务。数据集基于danbooru2021构建,扩展至包含ID #6,857,737的图像,增加了超过180万张新图像,总大小约为8TB。图像以原始格式提供,分为1000个子目录,使用图像ID的模1000进行分桶,以避免文件系统性能问题。
hugging_face 收录