IGNF/PureForest|林业遥感数据集|机器学习数据集
收藏数据集概述
名称: PureForest
许可证: etalab-2.0
大小: 100K<n<1M
任务类别:
- 图像分类
- 其他
标签:
- IGN
- 航空
- 环境
- 多模态
- 地球观测
- 激光雷达
- ALS
- 点云
- 森林
- 树种
数据集详细信息
描述:
- PureForest 数据集包含来自法国40个部门的449个不同森林的135,569个50m x 50m的补丁,覆盖总面积339平方公里。
- 每个补丁代表一个单一种类的森林,并标注有单一树种标签。
- 数据集包含13个语义类别,分层聚合了18种树种。
数据内容:
- 高密度航空激光雷达扫描(ALS)点云,密度为10脉冲/平方米,约40点/平方米。
- 具有RGB + 近红外通道的非常高分辨率(VHR)航空图像,空间分辨率为0.2米。
数据集划分:
- 训练集: 69,111个补丁
- 验证集: 13,523个补丁
- 测试集: 52,935个补丁
注释:
数据集范围和训练/验证/测试分割:
- 注释多边形主要在法国南部半部的40个行政部门中采样。
- 数据集按70%-15%-15%的比例分为训练、验证和测试集,按语义标签进行分层。
引用信息
@misc{gaydon2024pureforest, title={PureForest: A Large-Scale Aerial Lidar and Aerial Imagery Dataset for Tree Species Classification in Monospecific Forests}, author={Charles Gaydon and Floryne Roche}, year={2024}, eprint={2404.12064}, archivePrefix={arXiv}, url={https://arxiv.org/abs/2404.12064} primaryClass={cs.CV} }

学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
TT100K - Tsinghua-Tencent 100K
TT100K数据集是一个用于交通标志检测和识别的大规模数据集,包含100,000张标注的交通标志图像。该数据集主要用于计算机视觉和自动驾驶领域的研究。
cg.cs.tsinghua.edu.cn 收录
Wafer Defect
该数据集包含了七个主要类别的晶圆缺陷,分别是:BLOCK ETCH、COATING BAD、PARTICLE、PIQ PARTICLE、PO CONTAMINATION、SCRATCH和SEZ BURNT。这些类别涵盖了晶圆在生产过程中可能出现的多种缺陷类型,每一种缺陷都有其独特的成因和表现形式。数据集不仅在类别数量上具有多样性,而且在样本的多样性和复杂性上也展现了其广泛的应用潜力。每个类别的样本均经过精心标注,确保了数据的准确性和可靠性。
github 收录
rule34lol-images-part1
该数据集包含来自rule34.lol图像板的196,000个图像文件的元数据。元数据包括URL、标签、文件信息和点赞数。实际图像文件存储在zip存档中,每个存档包含1000个图像。该数据集是更大集合的一部分,分为Part 1和Part 2。数据集采用CC0许可,允许免费使用、修改和分发,无需署名。
huggingface 收录