five

CropDiseaseNer

收藏
github2023-03-08 更新2024-05-31 收录
下载链接:
https://github.com/shenjie-hyc/CropDiseaseNer
下载链接
链接失效反馈
官方服务:
资源简介:
农业病虫害命名实体识别数据集,使用BIO命名规则,预先定义好的命名实体类别包括病害、虫害、防治药剂、防治方法、为害症状、为害地区、作物。实体定义详细,如病害定义为农业病害名称,虫害定义为农业虫害名称等。数据集公开供学术研究使用,并欢迎补充。

The Agricultural Pest and Disease Named Entity Recognition Dataset employs the BIO (Begin, Inside, Outside) tagging scheme, with predefined named entity categories including diseases, pests, control agents, control methods, symptoms of damage, affected regions, and crops. The entities are meticulously defined; for instance, diseases are defined as names of agricultural diseases, and pests as names of agricultural pests. This dataset is publicly available for academic research and welcomes contributions.
创建时间:
2023-03-08
原始信息汇总

CropDiseaseNer 数据集概述

数据集名称

CropDiseaseNer

数据集描述

农业病虫害命名实体识别数据集,专注于农业领域的病虫害相关实体识别。

实体类别

数据集预先定义了以下实体类别:

  • 病害
  • 虫害
  • 防治药剂
  • 防治方法
  • 为害症状
  • 为害地区
  • 作物

实体定义

  • 病害:农业病害名称
  • 虫害:农业虫害名称
  • 防治药剂:防治农业病虫害的药剂学名、俗名、生物防治药剂名
  • 防治方法:防治农业病虫害的农业防治方法、生物防治方法等
  • 为害症状:农业病虫害危害作物的特征
  • 为害地区:发生农业病虫害的地区
  • 作物:农作物名称及品种

数据集用途

该数据集主要用于学术研究,旨在供研究者使用并提供反馈以完善数据集。

搜集汇总
数据集介绍
main_image_url
构建方式
CropDiseaseNer数据集的构建基于农业病虫害领域的专业知识,采用BIO命名规则对文本进行标注。数据集涵盖了病害、虫害、防治药剂、防治方法、为害症状、为害地区及作物等七类实体,每类实体均经过严格定义和标注。数据来源主要为农业领域的文献、报告及专家知识,确保了数据的权威性和准确性。标注过程由专业团队完成,并通过多轮校验以保证标注质量。
特点
CropDiseaseNer数据集的特点在于其专注于农业病虫害领域的命名实体识别,涵盖了丰富的实体类别,能够全面反映农业病虫害相关的知识体系。数据集的标注遵循BIO规则,结构清晰,便于模型训练与评估。此外,数据集的实体定义明确,标注样例直观,为研究者提供了高质量的参考标准。数据集的开放性和可扩展性也为后续研究提供了便利。
使用方法
CropDiseaseNer数据集适用于农业病虫害领域的命名实体识别任务。研究者可通过加载数据集,利用其标注信息训练和评估自然语言处理模型。数据集支持多种深度学习框架,可直接用于模型开发。使用过程中,建议结合领域知识对数据进行预处理,以提高模型的泛化能力。此外,研究者可根据需求对数据集进行扩展或优化,以支持更广泛的研究目标。
背景与挑战
背景概述
CropDiseaseNer数据集是一个专注于农业病虫害命名实体识别(NER)的专用数据集,旨在通过自然语言处理技术提升农业领域的信息提取能力。该数据集由研究团队于近年构建,主要面向农业病害、虫害及其相关防治信息的自动化识别与分析。数据集采用了BIO命名规则,涵盖了病害、虫害、防治药剂、防治方法、为害症状、为害地区及作物等七类实体,为农业病虫害的智能诊断与防治提供了重要的数据支持。该数据集的发布不仅推动了农业信息化的进程,也为相关领域的学术研究提供了宝贵的资源。
当前挑战
CropDiseaseNer数据集在构建与应用过程中面临多重挑战。首先,农业领域的专业术语复杂多样,病虫害名称、防治方法等实体具有较强的领域特异性,导致实体标注的准确性与一致性难以保证。其次,农业文本的多样性与非结构化特性增加了数据清洗与预处理的难度。此外,数据集的规模与覆盖范围仍需进一步扩展,以应对不同地区、不同作物的病虫害识别需求。这些挑战不仅影响了模型的泛化能力,也对数据集的持续优化提出了更高的要求。
常用场景
经典使用场景
CropDiseaseNer数据集在农业信息处理领域具有重要应用,特别是在农业病虫害的命名实体识别(NER)任务中。该数据集通过BIO命名规则,精确标注了病害、虫害、防治药剂等关键实体,为研究人员提供了丰富的标注数据,用于训练和评估NER模型。其经典使用场景包括农业文本的自动化处理、病虫害信息的智能提取与分析,以及农业知识图谱的构建。
衍生相关工作
基于CropDiseaseNer数据集,许多经典研究工作得以展开,例如农业病虫害知识图谱的构建、农业文本的语义理解模型开发以及病虫害防治方案的智能推荐系统。这些研究不仅深化了农业领域的信息处理技术,还为农业智能化发展提供了理论支持和技术保障。
数据集最近研究
最新研究方向
在农业信息化和智能化的背景下,CropDiseaseNer数据集为农业病虫害的命名实体识别提供了重要的数据支持。该数据集通过BIO命名规则,详细标注了病害、虫害、防治药剂、防治方法、为害症状、为害地区及作物等实体类别,为农业领域的自然语言处理研究奠定了坚实基础。近年来,随着深度学习技术的快速发展,基于该数据集的命名实体识别模型在精度和效率上取得了显著提升,尤其在农业病虫害的早期预警和智能诊断系统中展现出巨大潜力。此外,该数据集还推动了农业知识图谱的构建,为农业决策支持系统提供了更为精准的数据支撑,进一步促进了农业生产的智能化和精准化发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作