Edustories-en

Name: Edustories-en
Creator: NLP Centre, Faculty of Informatics, Masaryk University
Published: 2024-09-15 00:44:57
License: 暂无描述

Hugging Face2024-09-15 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/MU-NLPC/Edustories-en

下载链接

链接失效反馈

官方服务：

资源简介：

Edustories数据集包含从Edustories.cz平台获取的结构化情境描述，主要涉及候选教师在课堂中的案例。每个条目包括背景描述、情境描述、教师干预描述和干预结果描述。数据集还包括手动标注的类别，用于描述情境、干预和结果，以及学生的属性和教师的属性。捷克语的结构化故事部分也包含在内。数据集正在开发中，未来计划扩展更多未标注的故事。

提供机构：

NLP Centre, Faculty of Informatics, Masaryk University

创建时间：

2024-09-14

搜集汇总

数据集介绍

构建方式

Edustories-en数据集的构建过程体现了教育案例研究的系统化与标准化。该数据集源自Edustories.cz平台，通过半自动解析原始自由文本日志，并结合数据库中的附加信息，形成了结构化的教育案例描述。每个案例均经过匿名化处理，并由标注者手动关联多个类别，以最佳匹配所描述的情境、干预措施及其结果。数据收集由实习教师在其教学实践中完成，采用标准化表格记录，并经过多阶段匿名化处理，确保数据隐私。

特点

Edustories-en数据集的特点在于其高度结构化的教育案例描述与丰富的标注信息。每个案例包含背景描述、情境分析、教师干预措施及结果等结构化文本，并附有标注者手动关联的问题、解决方案及影响类别。此外，数据集还提供了学生与教师的属性信息，如年龄、诊断、教学经验等，为教育研究提供了多维度的分析视角。数据集支持双语（英语与捷克语），并包含不确定标注类别，为研究提供了灵活性。

使用方法

Edustories-en数据集适用于教育领域的文本分类与案例研究任务。研究者可通过分析结构化文本与标注信息，探索教学干预的效果、学生行为模式及教师决策过程。数据集中的不确定标注类别可用于评估标注一致性，而双语支持则为跨语言研究提供了便利。用户可通过HuggingFace平台下载数据集，并根据需求选择英语或捷克语版本进行深入研究。

背景与挑战

背景概述

Edustories-en数据集由捷克马萨里克大学的Jan Nehyba、Jiřina Karasová和Michal Štefánik等研究人员于2023年至2026年间创建，旨在收集和分析教育实践中的案例研究。该数据集源自Edustories.cz平台，记录了实习教师在教学实践中收集的课堂情境案例。每个案例包含背景描述、情境分析、教师干预措施及结果等结构化信息，并通过半自动解析和人工标注的方式，将每个案例与预定义的问题、解决方案和结果类别相关联。该数据集为教育研究提供了丰富的实证数据，有助于深入理解教学干预的效果及其对学生的影响。

当前挑战

Edustories-en数据集在构建过程中面临多重挑战。首先，数据来源于自由文本的课堂记录，需通过半自动解析和人工标注将其转化为结构化数据，这一过程对数据质量和一致性提出了较高要求。其次，标注过程中存在不确定性，部分标签由标注者在不确定的情况下分配，可能影响数据的可靠性。此外，数据集目前尚处于开发阶段，部分条目缺失，需在后续标注轮次中补充。最后，由于数据涉及学生和教师的个人信息，确保数据的匿名化和隐私保护也是构建过程中的重要挑战。

常用场景

经典使用场景

Edustories-en数据集在教育研究领域具有广泛的应用，尤其是在教师培训和教育干预策略的评估中。该数据集通过结构化的案例描述，帮助研究者分析教师在课堂中遇到的具体问题及其解决方案。这些案例不仅涵盖了学生的背景信息，还包括教师的干预措施和最终结果，为教育研究提供了丰富的实证数据。

实际应用

在实际应用中，Edustories-en数据集被广泛用于教师培训课程的设计与评估。通过分析数据集中的案例，教育机构可以为新教师提供更具针对性的培训内容，帮助他们更好地应对课堂中的复杂情境。此外，该数据集还可用于开发智能教育系统，通过自动化分析课堂案例，为教师提供个性化的教学建议。

衍生相关工作

基于Edustories-en数据集，许多经典研究工作得以展开。例如，研究者利用该数据集开发了基于机器学习的教育干预效果预测模型，能够根据课堂案例预测不同干预措施的潜在效果。此外，该数据集还催生了多项关于教师行为与学生表现之间关系的研究，为教育心理学和教育政策制定提供了重要的理论支持。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集