hyperspectral-fruit|高光谱成像数据集|图像处理数据集
收藏Living Optics Hyperspectral Fruit Dataset
概述
该数据集包含100张在受控光照条件下拍摄的各种水果和蔬菜的图像,使用Living Optics Camera。数据包括RGB图像、稀疏光谱样本和实例分割掩码。从100张图像中,我们提取了超过430,000个光谱样本,其中超过85,000个属于数据集中的19个类别之一。其余的光谱可用于训练分类器时的负采样。此外,提供了11张带标签的图像作为验证集。还提供了一组未标注的.lo
格式的演示视频,可用于定性测试基于此数据集构建的算法。
类别
训练数据集包含19个类别:
- 🍋 柠檬 - 8275个总光谱样本
- 🍈 甜瓜 - 9507个总光谱样本
- 🥒 黄瓜 - 227个总光谱样本
- 🍏 Granny Smith苹果 - 3984个总光谱样本
- 🍏 Jazz苹果 - 272个总光谱样本
- 🍎 塑料苹果 - 6693个总光谱样本
- 🍎 Pink Lady苹果 - 17311个总光谱样本
- 🍎 Royal Gala苹果 - 21319个总光谱样本
- 🍅 番茄 - 3748个总光谱样本
- 🍅 樱桃番茄 - 360个总光谱样本
- 🍅 塑料番茄 - 569个总光谱样本
- 🫑 青椒 - 226个总光谱样本
- 🫑 黄椒 - 4752个总光谱样本
- 🫑 橙椒 - 552个总光谱样本
- 🍊 橙子 - 4641个总光谱样本
- 🍊 Easy Peeler橙子 - 2720个总光谱样本
- 🍐 梨 - 194个样本
- 🍇 绿葡萄 - 106个总光谱样本
- 🍋🟩 青柠 - 43个总光谱样本
下载说明
命令行
commandline mkdir -p hyperspectral-fruit huggingface-cli download LivingOptics/hyperspectral-fruit --repo-type dataset --local-dir hyperspectral-fruit
Python
python from huggingface_hub import hf_hub_download dataset_path = hf_hub_download(repo_id="LivingOptics/hyperspectral-fruit", filename="train", repo_type="dataset") print(dataset_path)
使用方法
python import os.path as op import numpy.typing as npt from typing import List, Dict, Generator from lo.data.tools import Annotation, LODataItem, LOJSONDataset, draw_annotations from lo.data.dataset_visualisation import get_object_spectra, plot_labelled_spectra from lo.sdk.api.acquisition.io.open import open as lo_open
加载数据集
path_to_download = op.expanduser("~/Downloads/hyperspectral-fruit") dataset = LOJSONDataset(path_to_download)
获取训练数据作为迭代器
training_data: List[LODataItem] = dataset.load("train")
检查数据
lo_data_item: LODataItem for lo_data_item in training_data[:3]: draw_annotations(lo_data_item) ann: Annotation for ann in lo_data_item.annotations: print(ann.class_name, ann.category, ann.subcategories)
绘制每个类别的光谱
fig, ax = plt.subplots(1) object_spectra_dict = {} class_numbers_to_labels = {0: "background_class"} for lo_data_item in training_data: object_spectra_dict, class_numbers_to_labels = get_object_spectra( lo_data_item, object_spectra_dict, class_numbers_to_labels )
plot_labelled_spectra(object_spectra_dict, class_numbers_to_labels, ax) plt.show()

CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
河湖“清四乱”监测
通过卫星遥感技术,对河流、湖泊、坑塘、水库等现状情况及变化趋势进行监测,对目标水域的水体富营养化、总磷、总氮等水质指标进行反演,对水利工程实施和建设进度进行跟踪监测,对河湖“四乱”行为进行监测排查,帮助用户快速掌握水域面积和水质变化情况、水利工程设施的建设进展情况以及追溯河湖“四乱”整治情况。
上海数据交易所登记层 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录