Oliver369X/adaption-andean-educational-prompts
收藏Hugging Face2026-05-02 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/Oliver369X/adaption-andean-educational-prompts
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个经过重新制作的版本,包含针对安第斯和亚马逊地区农村和土著社区设计的上下文教育活动的提示-完成对。内容涵盖了跨文化教育学、基于社区的项目以及使用当地材料教授数学和艺术等主题。每个条目都提供了详细、文化敏感的指导,针对特定的环境如查科、贝尼或高地山谷。数据集的大小为1,786个数据点,质量评级为A,相对质量提高了40.0%。领域主要集中在学术教育(96%),其次是文化(2%)和农业(2%)。语言为西班牙语(100%),语气主要为教育性(48%)、实用性(28%)和专业性(18%)。
This dataset is a remastered version prepared using Adaptions Adaptive Data platform. It contains prompt-completion pairs focused on designing contextualized educational activities, curricula, and evaluation tools for rural and indigenous communities in the Andes and Amazon regions. The content covers topics such as intercultural pedagogy, community-based projects, and the use of local materials for teaching subjects like math and art. Each entry provides detailed, culturally sensitive instructions tailored to specific environments like the Chaco, Beni, or highland valleys. There are 1,786 data points in this dataset, with a quality rating of A and a relative quality improvement of 40.0%. The domain is primarily academic-education (96%), followed by culture (2%) and agriculture (2%). The language is Spanish (100%), and the tone is mainly educational (48%), practical (28%), and professional (18%).
提供机构:
Oliver369X
搜集汇总
数据集介绍

构建方式
该数据集基于Adaption公司的自适应数据平台重新制作而成,旨在为安第斯山脉与亚马逊地区的农村及原住民社区设计情境化教育活动、课程与评估工具。通过构建指令微调数据集,每一对提示-完成组合均提供了细致入微、文化敏感的指导,内容涵盖跨文化教学法、社区项目策划以及利用当地材料教授数学与艺术等学科,特别针对查科、贝尼或高地山谷等特定环境进行了定制。
使用方法
本数据集专用于指令微调,研究人员可直接利用其中的提示-完成配对,训练或优化针对安第斯与亚马逊地区文化教育情境的语言模型。使用时,可根据领域(如学术教育、文化、农业)或语调(教育性、实用性、专业性)筛选数据,以适配特定教学或课程设计任务。数据集以标准格式提供,便于集成至现有训练流程。
背景与挑战
背景概述
该数据集由Adaption平台基于自适应数据处理技术重新制作,专注于为安第斯山脉和亚马逊地区的农村及土著社区设计情境化教育活动、课程与评估工具。创建于近年,核心研究人员来自Adaption Labs,旨在解决多元文化背景下教育资源匮乏的问题。涵盖跨文化教学法、社区项目及本地材料在数学、艺术等学科中的应用,强调文化敏感性与环境适配性。数据集以西班牙语为主,包含1786条指令微调样本,质量评级为A级,相对提升40%,对推动教育技术领域中的文化包容性与本地化教育模型具有重要参考价值。
当前挑战
该数据集面临的挑战主要源于跨文化教育资源的稀缺与构建复杂性。首先,安第斯和亚马逊地区的土著社区语言、习俗差异显著,通用教育模型难以直接适配,需深度整合本地知识与教学实践,如使用本地材料教授抽象学科。其次,数据构建过程中需平衡文化敏感性与实用性,避免刻板印象或信息失真,同时确保指令的详细性与可操作性。此外,数据集规模有限(仅千余条),在保证高质量的前提下扩展覆盖面仍是难点,且评估自动化工具可能无法完全捕捉文化语境中的教育成效,需人工校验与领域专家参与。
常用场景
经典使用场景
在安第斯与亚马逊地区的农村和原住民社区中,教育资源的匮乏与文化脱节长期制约着当地发展。该数据集通过提供精心设计的提示-完成对,专注于构建情境化教学活动、课程体系及评估工具,内容涵盖跨文化教学法、社区参与式项目及利用本地材料教授数学与艺术等学科。其经典使用场景在于为大型语言模型提供指令微调(instruction tuning)数据,使模型能够生成贴合查科、贝尼或高地山谷等特定地域环境、具有文化敏感性的教育指导方案,从而弥合主流教育模式与原住民文化之间的鸿沟。
解决学术问题
在跨文化教育研究领域,一个核心挑战是缺乏能够反映原住民知识体系与地方性实践的训练数据集。该数据集通过收录涵盖96%学术教育、2%文化与2%农业领域的双语(西班牙语)指令样本,直接回应了如何将本土文化基因融入通用教育框架的学术难题。其意义在于为计算语言学与教育人类学的交叉研究提供了实证基础,使研究者能够系统性地探索模型在低资源、高语境下的文化适配能力,进而推动个性化与包容性教育算法的发展。
实际应用
在实际应用中,该数据集可作为智能教育系统的核心数据支撑。例如,在秘鲁或玻利维亚的农村学校,教师可借助基于该数据集微调的模型快速生成融合当地农业节令或传统纺织技艺的数学练习题;非政府组织也能利用其开发社区培训材料,将安第斯作物种植知识融入科学课程。此外,该数据集还可为多语言教育平台提供西班牙语变体(如安第斯方言)的指令理解能力,提升数字教育资源在拉美原住民社区的可及性与接受度。
数据集最近研究
最新研究方向
面向安第斯及亚马逊地区原住民与农村社区的跨文化教育指令微调数据集,聚焦于将本土知识体系、社区参与式教学法及地方材料应用融入数学、艺术等学科的教学设计,旨在通过高质量(A级质量,相对提升40%)的西班牙语语料推动多模态、低资源环境下的教育AI模型适配地域文化差异,为拉丁美洲边缘化群体提供更具包容性的智能教育工具,同时探索农业与文化传承在数字化学习中的创新融合路径。
以上内容由遇见数据集搜集并总结生成



