AgriCoT

Hugging Face2025-11-28 更新2025-11-29 收录

下载链接：

https://huggingface.co/datasets/wenyb/AgriCoT

下载链接

链接失效反馈

官方服务：

资源简介：

AgriCoT是一个用于评估视觉语言模型在农业领域推理能力的链式思维基准数据集，包含4535个经过精心挑选的样本。数据集聚焦于模型在零样本场景下的逻辑推理和有效问题解决能力。关键特性包括对象检测、定量分析、疾病监测、空间理解和环境管理等问题导向任务，以及理解问题、描述图像、检索相关知识、逻辑推理和提供最终答案的链式思维推理过程。

创建时间：

2025-11-25

原始信息汇总

AgriCoT 数据集概述

基本描述

AgriCoT 是一个用于评估农业领域视觉语言模型推理能力的链式思维基准数据集，包含 4,535 个精心筛选的样本，专注于零样本场景下的逻辑推理和问题解决能力评估。

核心特征

问题导向：涵盖目标检测、定量分析、疾病监测、空间理解和环境管理五大领域
链式思维推理：包含问题理解、图像描述、相关知识检索、逻辑推理和最终回答五个推理步骤

技术规格

任务类别：问答
领域标签：生物学
数据规模：10K-100K 范围

数据来源

CDDM (https://github.com/UnicomAI/UnicomBenchmark/tree/main/CDDMBench)
AGMMU (https://huggingface.co/datasets/AgMMU/AgMMU_v1)
AgroMind (https://huggingface.co/datasets/AgroMind/AgroMind)
AgroBench (https://huggingface.co/datasets/risashinoda/AgroBench)

文件结构

./ ├── AgMMU ├── AgroBench ├── AgroMind ├── CDDM └── VQRA.json

数据格式

VQRA.json 文件包含以下字段结构：

question：自然语言问题
image_path：图像文件路径
options：答案选项（如适用）
answer：正确答案
type_id：问题响应格式类型
reasoning：链式思维推理过程
item_id：问题标识符（从1开始）
dimension_id：一级任务维度
sub_dimension_id：二级任务维度

许可信息

采用 CC BY-SA 4.0 许可证

相关论文

论文链接即将发布

搜集汇总

数据集介绍

构建方式

在农业智能分析领域，AgriCoT数据集通过整合四个权威农业视觉问答基准——CDDM、AGMMU、AgroMind和AgroBench，构建了涵盖4,535个样本的评估体系。其构建过程严格遵循多维度任务分类原则，依据对象检测、定量分析、疾病监测等五大农业核心问题设计数据框架，每个样本均包含图像路径、自然语言问题及结构化标注，确保数据来源的多样性与专业性。

使用方法

研究人员可通过解析VQRA.json文件中的结构化数据开展实验，每条记录包含问题文本、图像路径及思维链推理过程。使用时应结合图像模态与文本模态的协同分析，依据维度标识符划分任务类型，在零样本设定下验证模型从感知到决策的连贯推理能力，最终通过对比预测答案与标注答案评估模型性能。

背景与挑战

背景概述

在智慧农业与人工智能交叉研究领域，AgriCoT数据集作为2024年推出的链式思维评估基准，由农业信息学与计算机视觉领域的跨学科团队共同构建。该数据集聚焦于农业场景下的视觉语言模型推理能力评估，通过整合CDDM、AGMMU等四大权威农业视觉数据源，构建了涵盖目标检测、病害监测、空间理解等五大核心维度的评估体系。其4535个精心标注的样本为农业人工智能系统提供了零样本场景下的逻辑推理能力量化标准，显著推进了精准农业决策系统的智能化进程。

当前挑战

该数据集致力于解决农业视觉问答中多模态语义对齐的经典难题，包括作物生长周期中的动态特征识别、复杂自然环境下的视觉干扰消除等核心挑战。在构建过程中面临农业专业知识与视觉表征的深度融合障碍，需克服作物病理特征标注的主观差异性，同时解决跨数据源间的标注标准统一问题。此外，链式思维标注要求标注者同时具备农业领域知识和逻辑推理表达能力，这种复合型人才稀缺成为数据质量保障的主要瓶颈。

常用场景

经典使用场景

在农业智能分析领域，AgriCoT数据集通过4,535个精心设计的视觉语言样本，为评估模型在零样本场景下的链式推理能力提供了标准化测试平台。其典型应用涵盖物体检测、定量分析及病害监测等核心任务，要求模型结合图像内容与领域知识进行多步骤逻辑推演，最终生成准确答案。这种结构化评估方式显著提升了农业视觉语言模型在复杂环境中的认知与决策能力。

解决学术问题

该数据集有效应对了农业领域视觉语言模型缺乏系统性推理评估的学术难题。通过构建包含空间理解、环境管理等维度的多层次任务体系，解决了传统方法在逻辑连贯性与知识融合方面的局限性。其链式推理标注机制为研究社区提供了可解释性分析框架，推动了对模型认知机理的深入探索，填补了专业领域复杂推理能力量化评估的空白。

实际应用

在实际农业场景中，该数据集支撑的智能系统可应用于作物生长监测、病虫害早期诊断等关键环节。通过解析田间图像与自然语言查询的深层关联，模型能够为农户提供精准的种植建议与风险预警。这种技术显著提升了农业管理的科学化水平，为智慧农业的决策自动化与精准化部署奠定了实践基础。

数据集最近研究