five

YieldVision Agricultural Dataset

收藏
github2024-08-08 更新2024-08-09 收录
下载链接:
https://github.com/variyas31/YieldVision
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含影响农作物产量的多种特征,包括天气条件、土壤性质和农业实践。关键特征有土壤持水能力、作物产量、以及与生长相关的天气和生长指标。

This dataset contains multiple features that affect crop yield, including weather conditions, soil properties, and agricultural practices. The key features include soil water-holding capacity, crop yield, and growth-related weather and growth indicators.
创建时间:
2024-08-08
原始信息汇总

🌾📊 YieldVision: Advanced Machine Learning & Causal Analysis on Agricultural Yield Data 🌾📊

📊 Dataset Details

The dataset contains various features that potentially impact crop yield, including weather conditions, soil properties, and agricultural practices. Key features include:

  • soilCapacity: Soil water holding capacity
  • yield: Crop yield
  • EpSum, EpAfterFlowering, CGRAroundFlowering, EpSum_1: Weather and growth-related metrics

APSIM Output Variables

APSIM’s text, space-separated output files can be flexibly configured. The time dimension is represented by rows, and the state dimension is represented by columns. Multiple independent output components can be configured in a simulation.

Periodicity of Output:

  • 🕒 Rows (Temporal): Common periods include daily, weekly, harvest, and annual (calendar). Each period is characterized by an event that marks its termination. Depending on this interval, variables may need to be averaged, summed, etc.
  • 📊 Columns: APSIM’s modules have variables that can be reported.

Table of Useful Variables:

Meteorological 🌤️:

  • 🌧️ rain: (mm/day)
  • 🌡️ maxt, mint: (9 AM min, max temperatures)
  • ☀️ radn: (Mj/m²) solar radiation

Soil Related 🌱:

  • 🌍 dlayer: Depth of layer i (array of mm)
  • 💧 SW: Instantaneous water content (mm/mm)
  • 🪨 Air_dry, LL15, DUL, SAT: Static limits of bucket size (array of mm/mm)
  • 🌿 XX_dep: Same as above, but in (array of mm/layer)
  • 🌾 ESW: Extractable soil water (mm) - relative to LL15
  • 🌫️ ES: Soil evaporation (mm/day)
  • 💦 EO: Potential (unlimited) soil evaporation
  • 💨 EOS: Potential (unlimited) soil evaporation limited by cover
  • 🌳 cover_surface_runoff: Total cover from crops & residues, adjusted for height (0-1)
  • 🚰 Runoff: Water that doesn’t infiltrate must run off
  • 🌊 Drain: Water content above DUL drains into layers below. The bottom layer drains to...
  • 🍂 surfaceom_wt: Surface residue - stubble & harvester remains (kg/ha)
  • 🧪 NO3: Nitrogen - key plant nutrient (kg/ha), from both fertilizer and residue decomposition

Crop Related 🌾 (All weights are dry):

  • 🌿 biomass_wt: Total instantaneous weight (g/m²)
  • 🥬 biomass_n: N content (g/m²)
  • 🍃 [root, leaf, stem, grain]GreenWt: Active plant organ weights
  • 🌾 XXXGreenN: N content of organs (g/m²)
  • 🌿 cover_green: Green (photosynthetically active) cover (0-1)
  • 🍂 cover_tot: Green and senesced cover (0-1)
  • 🌡️ TT: Instantaneous Thermal Time (°C/day) - development rate
  • 💧 Ep: Water uptake (mm)
  • 🌱 Height: Height of crop (mm)
  • 🍃 LAI: Leaf Area Index (m²/m²)
  • ☀️ FiPAR: Fraction of intercepted photosynthetically active radiation
  • 🍂 SLAI: Senesced leaf area index (m²/m²)
  • 🌱 LL: Crop-specific lower limit of water extraction (array of mm/mm)
  • 🌿 nfact_photo: Instantaneous stress factor in photosynthesis calculation (0-1)
  • 🌱 root_depth: Depth that roots extend to (mm)
  • 💧 swdef_photo: Soil water deficit factor in photosynthesis calculation (0-1)
  • 📅 StageName: The (instant) phenological stage name
  • 🌾 Yield: Grain yield (kg/ha)

Useful Summaries 📊:

  • 💧 Crop starting & finishing water content: Used to calculate gross Water Uptake
  • 💧 In-crop water uptake: Key measure of transpiration
  • 🌱 PAWC: Plant Available Water (Capacity/Content) (mm)
  • 🌾 Harvest Index (HI): Grain yield / total weight - efficiency measure
  • 💧 Water Use Efficiency (WUE): Grain produced / water used (kg/mm)
  • ☀️ PhotoThermalQuotient (PTQ): Mean(radiation / mean temperature) over significant crop phases
  • 📊 NDVI vs. LAI: LAI is the green component; NDVI is a reflectance
搜集汇总
数据集介绍
main_image_url
构建方式
YieldVision Agricultural Dataset的构建基于对大规模农业数据的深入分析,结合了先进的机器学习和因果推断技术。数据集的构建过程包括数据预处理、探索性数据分析(EDA)、特征选择、模型训练与评估以及因果推断等多个步骤。通过处理缺失值、标准化特征以及准备数据模型,确保数据集的清洁和适用性。特征选择阶段采用逐步前向选择和后向消除技术,以识别最具预测性的特征。模型训练阶段应用了多种回归模型,如线性回归、Lasso回归、Ridge回归和随机森林,以预测作物产量。因果推断则通过DoWhy和Causal Forests等方法,评估选定特征对作物产量的因果效应。
使用方法
使用YieldVision Agricultural Dataset时,用户首先需要下载数据集并将其放置在`data/`目录中。随后,用户可以通过运行Jupyter Notebooks进行分析,这些Notebooks位于`notebooks/`目录下。数据集的使用包括数据预处理、探索性数据分析、特征选择、模型训练与评估以及因果推断等多个步骤。用户可以根据需要选择不同的机器学习模型进行作物产量预测,并通过因果推断技术进一步理解特征对产量的影响。此外,数据集还提供了详细的文档和示例代码,帮助用户快速上手并进行深入分析。
背景与挑战
背景概述
农业产量预测一直是农业科学和实践中的核心问题。YieldVision Agricultural Dataset由先进机器学习和因果分析技术驱动,旨在深入理解影响作物产量的因素,并基于天气条件、土壤特性和农业实践进行准确预测。该数据集由variyas31创建,主要研究人员或机构未明确提及,但其对农业产量预测领域的贡献显著,特别是在利用多变量数据进行精准农业管理方面。
当前挑战
YieldVision Agricultural Dataset在构建和应用过程中面临多项挑战。首先,数据预处理阶段需处理大量缺失值和标准化特征,确保数据质量。其次,特征选择过程中需识别对预测模型最具影响力的特征,这涉及复杂的统计分析。此外,模型训练和评估需应用多种机器学习模型,并比较其性能,以确定最有效的预测方法。最后,因果推断技术的应用旨在量化关键特征对作物产量的因果效应,这一过程需克服数据噪声和多重共线性等问题。
常用场景
经典使用场景
在农业科学领域,YieldVision Agricultural Dataset 的经典使用场景主要集中在利用高级机器学习和因果分析技术,深入研究影响农作物产量的关键因素。通过该数据集,研究者能够系统地分析天气条件、土壤特性和农业实践对作物产量的综合影响,从而实现对农作物产量的精准预测。这种预测不仅有助于优化农业生产策略,还能为农业政策制定提供科学依据。
解决学术问题
YieldVision Agricultural Dataset 解决了农业科学中长期存在的关于影响作物产量因素的复杂性问题。通过集成多种机器学习模型和因果推断方法,该数据集能够精确量化各环境因素和农业实践对作物产量的因果效应,填补了传统统计方法在这一领域的空白。这不仅提升了作物产量预测的准确性,还为农业科学研究提供了新的方法论和工具。
实际应用
在实际应用中,YieldVision Agricultural Dataset 被广泛用于农业生产的各个环节。例如,农民和农业专家可以利用该数据集优化灌溉和施肥策略,以提高作物产量和资源利用效率。此外,农业科技公司和政策制定者也可以通过该数据集评估不同农业政策和技术对作物产量的影响,从而制定更为科学和有效的农业发展规划。
数据集最近研究
最新研究方向
在农业领域,YieldVision Agricultural Dataset的最新研究方向主要集中在利用高级机器学习和因果推断技术来深入分析影响作物产量的因素。研究者们通过数据预处理、探索性数据分析(EDA)、特征选择、模型训练与评估以及因果推断等步骤,旨在精确预测作物产量。特别地,因果推断方法如DoWhy和Causal Forests被广泛应用于估计特定特征对作物产量的因果效应,从而为农业实践提供科学依据。此外,通过比较不同模型的性能,研究者们致力于识别最有效的预测方法,以提升农业生产的效率和可持续性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作