danaroth/cave|多光谱成像数据集|相机模拟数据集
收藏数据集描述
该数据库包含一组多光谱图像,用于模拟GAP相机。这些图像涵盖了各种真实世界的材料和物体。
图像捕获信息
项目 | 信息 |
---|---|
相机 | 冷却CCD相机(Apogee Alta U260) |
分辨率 | 512 x 512像素 |
滤镜 | VariSpec液晶可调滤光片 |
光源 | CIE标准光源D65 |
波长范围 | 400nm - 700nm |
步长 | 10nm |
波段数量 | 31个波段 |
焦距 | f/1.4 |
焦点 | 固定(使用550nm图像对焦) |
图像格式 | PNG(16位) |
注意:这些多光谱图像代表了场景中材料的反射率。每个像素的反射光谱是从测量的多光谱图像中使用校准的照明光谱和相机光谱响应估计计算得出的。因此,每个多光谱图像应视为真实反射率的近似值,而不是精确测量。
数据库组织
数据库包含32个场景,分为5个部分。每个场景都有一个相关的压缩文件。这些压缩文件包括从400nm到700nm以10nm步长(共31个波段)的全光谱分辨率反射率数据。每个波段存储为16位灰度PNG图像。图像文件名格式为object_ms_01.png,其中01表示这是第一个图像(在400nm捕获)。因此,02对应410nm,依此类推,直到31对应700nm。
每个场景还包含一个代表性的彩色图像,使用中性日光光源(D65)下的sRGB值显示。
访问说明
32个场景的数据库分为5个部分:
- Stuff
- Skin and hair
- Paints
- Food and drinks
- Real and fake
相关项目
Generalized assorted pixel camera
贡献
该数据集最初由哥伦比亚大学提供,可访问以下链接获取:
https://www.cs.columbia.edu/CAVE/databases/multispectral/
出版物
数据库的详细信息可在以下出版物中找到:
"Generalized Assorted Pixel Camera: Post-Capture Control of Resolution, Dynamic Range and Spectrum," F. Yasuma, T. Mitsunaga, D. Iso, and S.K. Nayar, Technical Report, Department of Computer Science, Columbia University CUCS-061-08, Nov. 2008.
PDF - bib - (C) - Project Page

Traditional-Chinese-Medicine-Dataset-SFT
该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。
huggingface 收录
ST-EVCDP
这是一个关于公共电动汽车充电桩的时空充电需求预测的实际数据集,涵盖了18,061个公共充电桩的数据,包括坐标、充电器数量、占用情况和价格等信息。数据集用于学术研究,支持区域电动汽车充电需求预测。
github 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
PlantVillage
在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。
OpenDataLab 收录
NSL-KDD
NSL-KDD数据集是一个用于测试入侵检测算法的网络流量数据集。它是KDD Cup 1999数据集的改进版本,解决了原始数据集中的冗余记录和类别不平衡问题。该数据集包含训练和测试数据文件,以及包含数据集列名的文件。
github 收录