five

Myanmar Agriculture 1K

收藏
github2024-08-23 更新2024-08-24 收录
下载链接:
https://github.com/MinSiThu/Myanmar-Agriculture-1K
下载链接
链接失效反馈
官方服务:
资源简介:
Myanmar Agriculture 1K数据集是一个用缅甸语编制的农业数据集,包含关于缅甸主要作物和树木、农业和园艺方法、化学品和农药、植物病理学、气候变化和有机肥料的信息。该数据集旨在促进缅甸语在自然语言处理领域的应用,并推动缅甸语从低资源语言向高资源语言的转变。

Myanmar Agriculture 1K Dataset is an agricultural dataset compiled in Burmese. It covers information on Myanmar's major crops and trees, agricultural and horticultural practices, agrochemicals and pesticides, phytopathology, climate change and organic fertilizers. This dataset is designed to promote the application of Burmese in the field of natural language processing, and facilitate the transition of Burmese from a low-resource language to a high-resource language.
创建时间:
2024-08-05
原始信息汇总

Myanmar-Agriculture-1K 数据集概述

数据集简介

  • 名称:Myanmar-Agriculture-1K
  • 语言:缅甸语
  • 贡献者:Min Si Thu, Khin Myat Noe

数据集目的

  • 构建缅甸语自然语言处理的语料库。
  • 训练缅甸语指令微调语言模型。
  • 促进缅甸语从低资源语言向高资源语言转变。

数据集内容

  • 时间:2024年8月创建
  • 格式:包含两列(Instruction 和 Output),存储在 Agriculture.csv 文件中。
  • 条目数:1053条
  • 主题:主要作物和树木、农业和园艺方法、化学品和农药、植物病理学、气候变化、有机肥料等。

数据集创建过程

  • 阶段一:从维基百科网站标注信息。
  • 阶段二:审查和修正拼写及词汇错误。

数据集示例

  • 问题:စပါးကြဲပက်စိုက်ပျိုးနည်းကို ဘယ်အခါတွေမှာ အသုံးပြုသင့်သလဲ?
  • 答案:မိုးဦးကာလနှင့် မိုးလယ်ကာလ၊ မိုးခေါင်သောအခါ၊ ရေကြီးနစ်မြုပ်ဖြစ်တတ်သော ရေနက်ကွင်းများ၊ ဒီရေအတက်အကျရှိသော နေရာများ၊ သွင်းရေရရှိရန် မလွယ်ကူသော မိုးရေသောက် ကုန်းမြင့်ပိုင်းလယ်များ၊ အချိန်လု၍ စိုက်ပျိုးရန်လိုအပ်သည့် ကာလများ

数据集下载地址

  • Github: https://github.com/MinSiThu/Myanmar-Agriculture-1K
  • Zenodo: https://zenodo.org/records/13318601
  • Hugginface: https://huggingface.co/datasets/jojo-ai-mst/Myanmar-Agricutlure-1K
  • Kaggle: https://www.kaggle.com/datasets/minsithu/myanmar-agriculture-1k

数据集应用

  • 用于预训练或微调缅甸语大型语言模型。
  • 适用于构建基于RAG的应用程序。

致谢

  • 特别感谢 magickospace.org 对数据集创建过程的支持。

参考资料

  • 缅甸语维基百科:https://my.wikipedia.org/wiki/
  • 农业事实来源:https://www.doa.gov.mm/fes/index.php?route=common/home
搜集汇总
数据集介绍
main_image_url
构建方式
缅甸农业1K数据集由Min Si Thu和Khin Myat Noe于2024年8月精心构建。该数据集包含两个主要列:指令和输出,存储于Agriculture.csv文件中。数据集的构建过程分为两个阶段:首先,从维基百科网站和农业部门官网提取农业相关信息进行标注;随后,对数据集中的拼写和词汇错误进行审查和修正。这一过程确保了数据集的高质量和准确性。
使用方法
缅甸农业1K数据集可广泛应用于农业相关的自然语言处理应用。用户可以通过预训练或微调缅甸大型语言模型来利用该数据集。此外,该数据集还适用于构建基于检索增强生成(RAG)的应用程序。数据集可在GitHub、Zenodo、Hugging Face和Kaggle等多个平台下载,方便研究者和开发者使用。
背景与挑战
背景概述
缅甸农业1K数据集(Myanmar Agriculture 1K)是由Min Si Thu和Khin Myat Noe于2024年8月创建的,旨在为缅甸语的自然语言处理(NLP)研究提供一个开放的知识库。该数据集专注于农业领域的问题解答,涵盖了缅甸主要农作物、农业方法、园艺、化学品和农药、植物病理学、气候变化及有机肥料等多个方面。其核心研究问题是如何将缅甸语从低资源语言转变为高资源语言,从而推动缅甸语在NLP领域的应用和发展。
当前挑战
缅甸农业1K数据集在构建过程中面临多项挑战。首先,缅甸语作为低资源语言,缺乏丰富的语料库和标准化的数据集,这增加了数据收集和标注的难度。其次,数据集的构建需要从多个来源(如维基百科和农业部门网站)提取和整合信息,确保数据的准确性和一致性。此外,数据集的维护和更新也是一个持续的挑战,以确保其能够反映农业领域的最新知识和实践。
常用场景
经典使用场景
缅甸农业1K数据集在自然语言处理领域中,主要用于构建和微调缅甸语的大型语言模型。通过该数据集,研究人员可以训练出能够理解和回答农业相关问题的智能系统,从而提升缅甸语在农业领域的应用能力。
解决学术问题
该数据集解决了缅甸语在农业领域缺乏高质量、开放源代码数据的问题。它为缅甸语的自然语言处理研究提供了丰富的语料库,推动了缅甸语从低资源语言向高资源语言的转变,具有重要的学术价值和影响力。
实际应用
在实际应用中,缅甸农业1K数据集可用于开发农业信息查询系统、农业知识问答机器人等。这些应用能够帮助农民获取及时的农业信息,提高农业生产效率,促进农业现代化发展。
数据集最近研究
最新研究方向
在缅甸农业领域,Myanmar Agriculture 1K数据集的最新研究方向主要集中在利用自然语言处理(NLP)技术提升缅甸语在农业问答系统中的应用。该数据集不仅为缅甸语的NLP模型提供了丰富的训练数据,还推动了缅甸语从低资源语言向高资源语言的转变。研究者们正探索如何通过预训练和微调技术,构建适用于缅甸农业的智能问答系统,以解决农业生产中的实际问题,如作物病害识别、气候变化影响分析等。此外,该数据集的应用还扩展到农业政策解读和农业知识普及,为缅甸农业的现代化和智能化提供了技术支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作