Stanford Cars Dataset|汽车识别数据集|机器学习数据集
收藏数据集概述
数据集名称
Stanford Cars Dataset - Vehicle Recognition
数据集描述
- 数据量: 包含16,185张汽车图像。
- 类别数量: 共有196个汽车类别。
- 数据分割: 数据被分为训练集和测试集两部分。
- 图像特征: 图像包含车辆类别标签和边界框信息,类别详细到品牌、型号和年份。
- 图像格式: 图像为JPG格式,数据集以TGZ/TAR格式压缩。
数据集用途
- 用于构建车辆识别预测模型,目的是通过输入图像识别汽车的年份、品牌和型号。
- 潜在应用包括开发移动应用帮助用户识别感兴趣的车辆,以及用于交通法律执行中的车辆特征提取。
模型与算法
- 将探索多种分类算法,包括随机森林、支持向量机、增强方法及卷积神经网络。
- 分析自定义和最先进的CNN架构,并探索特征提取和选择方法。
- 通过添加至少30张图像到验证集来评估模型的实际预测能力。

LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
Desert Knowledge Australia Solar Centre PV Power Data
该数据集包含来自澳大利亚Alice Springs的Site 7的太阳能发电数据,包括有功功率(AP,kW)、历史温度(T,℃)、相对湿度(RH,%)、全球水平辐照度(GHI,Wh/m²)和漫射水平辐照度(DHI,Wh/m²)。
github 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
风电预测数据集
全球能源预测大赛(Global Energy Forecasting Competition ) 2012 - 风力发电赛道 所用数据集.
AI_Studio 收录