CAFOSat
收藏Hugging Face2025-05-23 更新2025-05-24 收录
下载链接:
https://huggingface.co/datasets/oishee3003/CAFOSat
下载链接
链接失效反馈官方服务:
资源简介:
CAFOSat数据集是一个遥感图像数据集,旨在识别和分类美国各州的集中动物饲养场(CAFOs)。它包含了高分辨率图像块、基础设施注释、边界框以及用于不同配置的实验性训练-测试分割。数据集支持动物饲养场的检测与分类、农业基础设施的映射、弱监督学习和半监督学习,以及遥感基准的开发。
创建时间:
2025-05-23
原始信息汇总
CAFOSat数据集概述
基本信息
- 名称: CAFOSat: CAFO Infrastructure Dataset
- 类型: 图像分类
- 许可证: CC BY 4.0
- 标签: 遥感, 卫星图像, 农业, 分类, 多标签, 边界框
- 数据规模: 10K<n<100K
数据集结构
- STATE_filtered/: 按美国州分类的原始图像块(如
IA_filtered/,AL_filtered/) - negative_samples/: 已验证的非CAFO示例
- barn/, manure_pond/, others/: 按基础设施类型分类的增强合成图像块
- cafosat.csv: 主元数据文件,包含标签、边界框和分割标志
图像文件引用
- patch_file: 指向图像文件的相对路径,格式为
IA_filtered.tar.gz::IA_filtered/crop_4517_patch_10147_Swine_Nursery_IA.tif
特征
| 列名 | 描述 |
|---|---|
patch_file |
图像文件路径 |
label |
类别标签(0-6) |
barn, manure_pond, grazing_area, others |
基础设施二进制标志 |
geom_bbox |
边界框坐标 [x1, y1, x2, y2] |
category |
类别名称(如Swine, Dairy) |
state |
图像块所属的美国州 |
verified_label |
人工验证的CAFO类型 |
CAFO_UNIQUE_ID |
设施唯一标识符 |
image_type |
图像类型(original, augmented, negative等) |
split columns |
不同训练/测试/验证集的分割标志 |
标签
| 类别ID | 类别名称 |
|---|---|
| 0 | Negative |
| 1 | Swine |
| 2 | Dairy |
| 3 | Beef |
| 4 | Poultry |
| 5 | Horses |
| 6 | Sheep/Goats |
分割
提供多种实验性训练-测试分割列:
cafosat_verified_training_train,cafosat_verified_training_test,cafosat_verified_training_valcafosat_all_training_*cafosat_training_set1_*,set2_*cafosat_merged_training_*cafosat_augmented_training_*
用途
- CAFO检测与分类
- 农业基础设施映射
- 弱监督、半监督学习
- 遥感基准开发
引用
*待定
许可证
- CC BY 4.0: 允许共享、使用和改编数据,需署名
联系方式
- 邮箱: gza5dr@virginia.edu
搜集汇总
数据集介绍
构建方式
在农业遥感监测领域,CAFOSat数据集通过系统化的数据采集与标注流程构建而成。该数据集整合了美国多个州的高分辨率卫星影像斑块,采用人工验证与自动化处理相结合的方式,对集中动物饲养场基础设施进行精细标注。构建过程中,研究人员从原始卫星影像中提取特定区域斑块,并通过专业标注团队对CAFO设施进行边界框标注和分类标识,同时引入负样本和增强合成样本以确保数据多样性。
使用方法
针对遥感影像分析任务,CAFOSat数据集提供了灵活的使用方案。研究人员可通过主元数据文件CAFOSat.csv访问完整的标注信息,利用预设的训练测试划分标志进行模型开发。数据集支持多种应用场景,包括CAFO检测分类、边界框定位和农业基础设施映射。使用过程中,用户可根据image_type字段区分真实影像与增强样本,通过verified_label筛选已验证数据,并利用poly_crs和patch_crs字段进行地理空间分析,实现精准的农业设施监测。
背景与挑战
背景概述
随着精准农业与环境监测需求的日益增长,高分辨率遥感技术在畜牧业设施识别领域展现出重要价值。CAFOSat数据集由弗吉尼亚大学研究团队于近年创建,专注于集中动物饲养操作的自动识别与分类研究。该数据集通过整合多州卫星影像与基础设施标注,构建了涵盖猪、奶牛、家禽等七类养殖设施的标准化样本库,为农业遥感与土地利用分析提供了关键数据支撑。
当前挑战
在集中动物饲养操作识别领域,类内差异与地域多样性对模型泛化能力构成显著挑战。数据构建过程中面临多源影像配准偏差、小目标特征提取困难等技术瓶颈,同时合成样本与真实场景的语义一致性验证仍需深入探索。弱监督标注的噪声干扰与边界框标注的空间精度控制,亦是影响模型性能的关键因素。
常用场景
经典使用场景
在农业遥感监测领域,CAFOSat数据集通过高分辨率卫星影像实现了集中动物饲养场(CAFO)的精准识别与分类。该数据集整合了多州地理空间数据与基础设施标注,支持从像素级分类到边界框定位的多层次分析,为环境科学研究提供了标准化的评估基准。其多标签标注体系能够同时识别猪场、奶牛场等六类养殖设施,并通过增强样本有效解决了遥感影像中类别不平衡的经典难题。
解决学术问题
该数据集显著推进了遥感影像弱监督学习领域的发展,通过部分标注数据与空间坐标优化机制,有效缓解了农业场景中标注样本稀缺的瓶颈问题。其提供的几何边界框与多坐标系标注,为地理空间深度学习模型提供了精准的回归目标,同时解决了跨区域CAFO设施分布异质性带来的模型泛化挑战,推动了遥感目标检测算法在复杂农业环境中的适应性进化。
实际应用
在环境监管实践中,该数据集支撑的检测模型已应用于美国多州的畜牧业污染源普查,通过自动化识别粪肥池、放牧区等关键基础设施,显著提升了农业面源污染的监测效率。相关技术还被整合至智慧农业管理平台,为养殖场选址评估、环境影响评价提供数据支撑,同时为公共卫生部门追踪人畜共患病传播路径提供了空间分析基础。
数据集最近研究
最新研究方向
在农业遥感监测领域,CAFOSat数据集正推动集中动物饲养场(CAFOs)智能识别的前沿探索。当前研究聚焦于多模态融合技术,通过结合高分辨率卫星影像与地理空间坐标数据,构建弱监督学习框架以突破标注样本稀缺的瓶颈。热点方向涵盖基于边界框的畜禽设施动态监测、合成数据增强策略在基础设施分类中的泛化能力验证,以及半监督方法在跨州域CAFO分布模式挖掘中的应用。这类研究对完善农业环境监管体系、评估养殖业碳排放具有显著意义,为可持续发展政策制定提供了数据驱动的决策支持。
以上内容由遇见数据集搜集并总结生成



