five

reglab/wisconsin-dairy-cafo

收藏
Hugging Face2026-04-30 更新2026-04-05 收录
下载链接:
https://hf-mirror.com/datasets/reglab/wisconsin-dairy-cafo
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个地理参考数据集,包含威斯康星州大型奶牛场的信息,通过卫星图像、计算机视觉、人工验证以及关键行政和开放地理空间数据源的合并而编译。数据集的主要输出是威斯康星州的1,469个大型奶牛场,包括许可证链接、动物单位估计、牛奶生产许可证链接和环境风险指数。数据集还包含用于生成这些结果的原始和中间数据集,以及分析代码,可以重现论文的关键结果。数据集的结构包括主出版物数据集(wi_cafo_facilities.*)和输入数据(input_data/),后者包括人类标注的谷仓多边形注释、WDNR CAFOs数据、EWG AFOs数据、许可证动物类型记录、牛奶生产许可证数据和地理空间数据等。

This is a geo-referenced dataset of large dairy farms in Wisconsin compiled using satellite imagery, computer vision, human validation, and merges to key administrative and open geospatial data sources. The main output of the study is 1,469 large dairy farms across Wisconsin, with permit linkage, animal unit estimates, milk producer license linkage, and environmental risk indices. The dataset also includes the raw and intermediate datasets used to generate these results, along with the analysis code that can reproduce the papers key results. The dataset structure includes the primary publication dataset (wi_cafo_facilities.*) and input data (input_data/), which consists of human-labeled barn polygon annotations, WDNR CAFOs data, EWG AFOs data, permit animal type records, milk producer license data, and geospatial data, among others.
提供机构:
reglab
搜集汇总
数据集介绍
main_image_url
构建方式
在环境遥感与监管科学领域,威斯康星州乳业集中动物饲养操作(CAFO)检测数据集的构建体现了多源数据融合与自动化识别的精密结合。该数据集通过深度学习分割模型,对高分辨率航空影像进行自动化畜棚多边形检测,并结合人工标注进行验证与修正。随后,利用空间聚类算法将相邻的检测多边形聚合为设施级别的记录,并与威斯康星州自然资源部的CAFO许可数据、农业部门的牛奶生产许可记录以及多种地理空间图层进行关联匹配,从而生成包含1,469个检测设施的综合记录。
使用方法
为有效利用该数据集,研究者可通过Geopandas库直接加载发布的GeoJSON、Parquet或CSV格式文件,快速获取包含几何信息与所有属性的空间数据框。数据集支持从本地文件或Hugging Face Hub进行加载,便于集成到现有的地理空间分析流程中。用户可依据设施分类、动物单位估算或环境风险指数进行筛选与统计,开展空间分布模式、许可合规性差距或环境敏感区邻近度等分析。结合配套的分析代码仓库,用户能够完整复现论文中的结果,或基于此进行扩展的环境与政策研究。
背景与挑战
背景概述
在环境科学与地理空间分析领域,对集约化动物饲养操作(CAFOs)的精准监测是评估农业污染与生态风险的关键。威斯康星州乳业CAFO检测数据集由斯坦福大学法学院RegLab研究团队于近期构建,旨在通过遥感技术与多源地理信息融合,系统识别威斯康星州的乳业CAFO设施。该数据集的核心研究问题聚焦于利用高分辨率航空影像自动检测畜牧建筑,并关联政府许可记录与环境风险指标,从而揭示未获许可的潜在污染源及其生态威胁。其创新性在于将计算机视觉模型与政策合规分析相结合,为环境监管与可持续农业研究提供了高精度的空间数据基础,推动了遥感在环境执法与公共政策评估中的实际应用。
当前挑战
该数据集致力于解决遥感领域在农业环境监测中的核心挑战,即如何从复杂景观中自动、精准地识别分散的畜牧设施,并评估其合规性与生态风险。具体挑战包括:在遥感影像中,畜牧建筑的形态、大小与背景(如农田、林地)差异显著,导致模型分割精度易受干扰;多源异构数据(如许可记录、水文地质图层)的时空对齐与融合存在不确定性,影响设施匹配与风险指标计算的可靠性。在构建过程中,研究团队面临标注数据稀缺的难题,需依赖人工标注与半自动方法生成训练样本;同时,整合来自不同政府部门(如WDNR、DATCP)的公开数据时,需处理数据格式不一致、坐标系统差异与更新周期不同步等问题,增加了数据集构建的复杂性与质量控制难度。
常用场景
经典使用场景
在环境科学与遥感监测领域,该数据集为研究密集型奶牛养殖场的空间分布与环境影响提供了关键数据支撑。其经典使用场景在于结合高分辨率航空影像与深度学习分割模型,系统性地识别威斯康星州境内的奶牛集中动物饲养操作设施,并评估其与水体、地下水及地形等环境要素的空间关联。通过整合多源地理空间数据与监管许可信息,该数据集支持对养殖设施的环境风险进行量化分析,为区域农业环境管理提供科学依据。
解决学术问题
该数据集有效解决了农业环境研究中若干关键学术问题,包括如何利用遥感技术大规模自动检测养殖设施、如何评估未获许可的潜在违规养殖操作、以及如何构建综合环境风险指数以量化养殖活动对水体和土壤的潜在威胁。通过提供精确的设施定位、动物单位估算及多维度环境风险指标,该数据集为理解养殖业扩张与环境合规性之间的动态关系提供了实证基础,推动了环境政策与空间分析方法的交叉融合。
实际应用
在实际应用层面,该数据集为政府监管机构、环境保护组织及农业管理部门提供了重要工具。监管机构可借助数据集识别未获许可或可能违规的养殖设施,加强环境执法效率;环境保护组织能够利用风险指数定位高环境敏感区域的养殖活动,倡导针对性保护措施;农业管理部门则可依据空间分布与风险评估结果,优化养殖业布局规划与可持续管理策略,促进农业与环境协调发展。
数据集最近研究
最新研究方向
在环境科学与遥感监测领域,Wisconsin Dairy CAFO数据集正推动着前沿研究,聚焦于利用深度学习与地理空间分析技术,实现大规模畜牧养殖设施的自动化检测与合规性评估。该数据集整合了高分辨率遥感影像、政府许可记录及环境风险图层,为识别未获许可的集中动物饲养操作提供了关键数据支撑,相关研究已延伸至监管科学领域,通过构建复合环境风险指数,量化养殖设施对地表水与地下水的潜在污染威胁。这些探索不仅提升了农业环境政策的执行透明度,也为全球畜牧业可持续发展监测树立了技术范式。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作