FungiTastic|真菌分类数据集|机器学习数据集
收藏数据集概述
数据集名称
The FungiTastic Dataset
数据集描述
FungiTastic 是一个综合性的多模态机器学习数据集,用于从图像和元数据中对真菌进行分类。该数据集包括真菌观察的图像、卫星图像、气象观测、分割掩码和文本元数据。元数据丰富了观察结果,包括时间戳、相机设置、GPS位置以及基质、栖息地和生物分类信息等属性。通过结合多种模态,该数据集支持强大的多模态分类基准,能够在现实和动态条件下开发和评估复杂的机器学习模型。
数据集内容
- 图像数据:包括真菌观察的图像、卫星图像和分割掩码。
- 元数据:包括时间戳、相机设置、GPS位置、基质、栖息地和生物分类信息等。
数据集子集
- FungiTastic Closed Set:包括训练集、验证集和测试集,分别包含246,884、45,616和48,379个观察结果。
- FungiTastic-M Closed Set:小型子集,主要用于原型设计,包含25,786、4,687和5,531个观察结果。
- FungiTastic-FS Closed Set:少数样本子集,包含4,293、1,099和998个观察结果。
- FungiTastic Open Set:包括训练集、验证集和测试集,分别包含246,884、47,453和50,085个观察结果。
- FungiTastic-M Open Set:小型子集,包含25,786、4,703和5,587个观察结果。
数据集统计
- 总图像数:超过650,000张。
- 总观察数:超过350,000个。
- 类别分布:具有长尾分布,具体分布见图2。
评估和指标
数据集考虑了五种不同的问题及其相应的评估指标:
- 具有重长尾分布的细粒度闭集分类。
- 带有分布外(OOD)检测的标准闭集分类。
- 使用非标准成本函数的分类。
- 用于基准测试适应方法的时间排序数据集上的分类。
- 具有少量训练观察的物种的少数样本分类。
基线结果
提供了不同架构在不同子集上的性能指标,包括Top1、Top3和F1m等。
数据集下载

学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
IUCN Red List
IUCN Red List(国际自然保护联盟濒危物种红色名录)是一个全球性的物种评估数据库,旨在提供关于生物多样性状况的科学信息。该数据集包含了全球范围内动植物物种的分类、分布、种群趋势、威胁因素和保护措施等信息。
www.iucnredlist.org 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录