plant-pathology-2021|植物病理学数据集|图像分类数据集
收藏Plant Pathology 2021 (FGVC8) Challenge Dataset
数据集概述
- 数据集名称: PlantPathology-Challenge-2021-FGVC8
- 数据集大小: 约23,000张高质量RGB图像
- 任务类别: 图像分类
- 标签类别:
- complex
- frog_eye_leaf_spot
- healthy
- powdery_mildew
- rust
- scab
- 数据集分割:
- 训练集: 16,768个样本
- 验证集: 1,864个样本
- 数据集来源: Kaggle Plant Pathology 2021 (FGVC8) Challenge
数据集特点
- 图像特征: 包含不同成熟阶段、不同拍摄时间和不同焦距设置下的叶片图像,背景非均匀。
- 多标签分类: 支持多标签图像分类任务。
数据集结构
- 特征:
image
: 图像数据labels
: 标签序列,包含6个类别label_names
: 标签名称序列image_id
: 图像ID
数据集使用
- 用途: 作为多标签图像分类数据集的示例。
引用
Thapa, Ranjita, Zhang, Kai, Snavely, Noah, Belongie, Serge, and Khan, Awais. Plant Pathology 2021 - FGVC8. https://kaggle.com/competitions/plant-pathology-2021-fgvc8, 2021. Kaggle.

coin_001_sample
这是一个包含180张精心拍摄的钱币图像的数据集,每张图像都采用极简摄影技术,以展示货币的视觉和触觉特性。数据集中的图像以PNG格式存储,拥有512x512的分辨率和170 dpi的清晰度,每个图像都配有至少40个文本标签。
huggingface 收录
Wind Turbine Data
该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。
www.kaggle.com 收录
中国1km分辨率逐月平均气温数据集(1901-2024)
该数据为中国逐月平均温度数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2024.12。数据格式为NETCDF,即.nc格式。数据单位为0.1 ℃。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录
SwimXYZ
SwimXYZ是由法国中央高等电力学院等机构创建的大型合成游泳动作和视频数据集,包含340万帧标注了2D和3D关节的图像,以及240个游泳动作序列。数据集通过使用GANimator生成多样化的游泳动作,并在Unity环境中模拟真实的水下环境。SwimXYZ旨在解决传统运动捕捉系统在游泳等水下运动中应用的局限性,特别是在缺乏标注数据的情况下。该数据集适用于游泳动作分析、2D和3D姿态估计等研究领域,有助于提升运动员训练和比赛表现的技术支持。
arXiv 收录
Historical Data Breaches Archive
这个仓库包含了一个全面且不断增长的历史数据泄露集合。所有存储在这里的数据泄露都是公开可用的,可以自由下载用于研究、分析或教育目的。
github 收录