five

CAFOSat

收藏
Hugging Face2025-05-23 更新2025-05-24 收录
下载链接:
https://huggingface.co/datasets/oishee3003/CAFOSat
下载链接
链接失效反馈
官方服务:
资源简介:
CAFOSat数据集是一个遥感图像数据集,旨在识别和分类美国各州的集中动物饲养场(CAFOs)。它包含了高分辨率图像块、基础设施注释、边界框以及用于不同配置的实验性训练-测试分割。数据集支持动物饲养场的检测与分类、农业基础设施的映射、弱监督学习和半监督学习,以及遥感基准的开发。
创建时间:
2025-05-23
原始信息汇总

CAFOSat数据集概述

基本信息

  • 名称: CAFOSat: CAFO Infrastructure Dataset
  • 类型: 图像分类
  • 许可证: CC BY 4.0
  • 标签: 遥感, 卫星图像, 农业, 分类, 多标签, 边界框
  • 数据规模: 10K<n<100K

数据集结构

  • STATE_filtered/: 按美国州分类的原始图像块(如IA_filtered/, AL_filtered/
  • negative_samples/: 已验证的非CAFO示例
  • barn/, manure_pond/, others/: 按基础设施类型分类的增强合成图像块
  • cafosat.csv: 主元数据文件,包含标签、边界框和分割标志

图像文件引用

  • patch_file: 指向图像文件的相对路径,格式为IA_filtered.tar.gz::IA_filtered/crop_4517_patch_10147_Swine_Nursery_IA.tif

特征

列名 描述
patch_file 图像文件路径
label 类别标签(0-6)
barn, manure_pond, grazing_area, others 基础设施二进制标志
geom_bbox 边界框坐标 [x1, y1, x2, y2]
category 类别名称(如Swine, Dairy)
state 图像块所属的美国州
verified_label 人工验证的CAFO类型
CAFO_UNIQUE_ID 设施唯一标识符
image_type 图像类型(original, augmented, negative等)
split columns 不同训练/测试/验证集的分割标志

标签

类别ID 类别名称
0 Negative
1 Swine
2 Dairy
3 Beef
4 Poultry
5 Horses
6 Sheep/Goats

分割

提供多种实验性训练-测试分割列:

  • cafosat_verified_training_train, cafosat_verified_training_test, cafosat_verified_training_val
  • cafosat_all_training_*
  • cafosat_training_set1_*, set2_*
  • cafosat_merged_training_*
  • cafosat_augmented_training_*

用途

  • CAFO检测与分类
  • 农业基础设施映射
  • 弱监督、半监督学习
  • 遥感基准开发

引用

*待定

许可证

  • CC BY 4.0: 允许共享、使用和改编数据,需署名

联系方式

  • 邮箱: gza5dr@virginia.edu
搜集汇总
数据集介绍
构建方式
在农业遥感监测领域,CAFOSat数据集通过系统化的数据采集与标注流程构建而成。该数据集整合了美国多个州的高分辨率卫星影像斑块,采用人工验证与自动化处理相结合的方式,对集中动物饲养场基础设施进行精细标注。构建过程中,研究人员从原始卫星影像中提取特定区域斑块,并通过专业标注团队对CAFO设施进行边界框标注和分类标识,同时引入负样本和增强合成样本以确保数据多样性。
使用方法
针对遥感影像分析任务,CAFOSat数据集提供了灵活的使用方案。研究人员可通过主元数据文件CAFOSat.csv访问完整的标注信息,利用预设的训练测试划分标志进行模型开发。数据集支持多种应用场景,包括CAFO检测分类、边界框定位和农业基础设施映射。使用过程中,用户可根据image_type字段区分真实影像与增强样本,通过verified_label筛选已验证数据,并利用poly_crs和patch_crs字段进行地理空间分析,实现精准的农业设施监测。
背景与挑战
背景概述
随着精准农业与环境监测需求的日益增长,高分辨率遥感技术在畜牧业设施识别领域展现出重要价值。CAFOSat数据集由弗吉尼亚大学研究团队于近年创建,专注于集中动物饲养操作的自动识别与分类研究。该数据集通过整合多州卫星影像与基础设施标注,构建了涵盖猪、奶牛、家禽等七类养殖设施的标准化样本库,为农业遥感与土地利用分析提供了关键数据支撑。
当前挑战
在集中动物饲养操作识别领域,类内差异与地域多样性对模型泛化能力构成显著挑战。数据构建过程中面临多源影像配准偏差、小目标特征提取困难等技术瓶颈,同时合成样本与真实场景的语义一致性验证仍需深入探索。弱监督标注的噪声干扰与边界框标注的空间精度控制,亦是影响模型性能的关键因素。
常用场景
经典使用场景
在农业遥感监测领域,CAFOSat数据集通过高分辨率卫星影像实现了集中动物饲养场(CAFO)的精准识别与分类。该数据集整合了多州地理空间数据与基础设施标注,支持从像素级分类到边界框定位的多层次分析,为环境科学研究提供了标准化的评估基准。其多标签标注体系能够同时识别猪场、奶牛场等六类养殖设施,并通过增强样本有效解决了遥感影像中类别不平衡的经典难题。
解决学术问题
该数据集显著推进了遥感影像弱监督学习领域的发展,通过部分标注数据与空间坐标优化机制,有效缓解了农业场景中标注样本稀缺的瓶颈问题。其提供的几何边界框与多坐标系标注,为地理空间深度学习模型提供了精准的回归目标,同时解决了跨区域CAFO设施分布异质性带来的模型泛化挑战,推动了遥感目标检测算法在复杂农业环境中的适应性进化。
实际应用
在环境监管实践中,该数据集支撑的检测模型已应用于美国多州的畜牧业污染源普查,通过自动化识别粪肥池、放牧区等关键基础设施,显著提升了农业面源污染的监测效率。相关技术还被整合至智慧农业管理平台,为养殖场选址评估、环境影响评价提供数据支撑,同时为公共卫生部门追踪人畜共患病传播路径提供了空间分析基础。
数据集最近研究
最新研究方向
在农业遥感监测领域,CAFOSat数据集正推动集中动物饲养场(CAFOs)智能识别的前沿探索。当前研究聚焦于多模态融合技术,通过结合高分辨率卫星影像与地理空间坐标数据,构建弱监督学习框架以突破标注样本稀缺的瓶颈。热点方向涵盖基于边界框的畜禽设施动态监测、合成数据增强策略在基础设施分类中的泛化能力验证,以及半监督方法在跨州域CAFO分布模式挖掘中的应用。这类研究对完善农业环境监管体系、评估养殖业碳排放具有显著意义,为可持续发展政策制定提供了数据驱动的决策支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作