five

TalkMoves数据集|教育技术数据集|教学方法数据集

收藏
arXiv2022-04-07 更新2024-06-21 收录
教育技术
教学方法
下载链接:
https://github.com/SumnerLab/TalkMoves
下载链接
链接失效反馈
资源简介:
TalkMoves数据集是由科罗拉多大学博尔德分校计算机科学系与认知科学研究所创建的,包含567个人工标注的K-12数学课程转录本。这些转录本主要来自视频记录,包括完整的课程或部分课程,涵盖了面对面和在线教学。数据集中的所有转录本都经过人工转录和分段,每个句子都被标注了基于负责任谈话理论的十种话语动作。此外,转录本还包括基于Switchboard对话动作语料库的对话动作标签。该数据集可用于教育者、政策制定者和研究人员理解K-12数学课堂中教师和学生对话的本质,并已用于开发TalkMoves应用程序,该应用程序为教师提供数学教学的自动化即时反馈。
提供机构:
科罗拉多大学博尔德分校计算机科学系与认知科学研究所
创建时间:
2022-04-07
AI搜集汇总
数据集介绍
main_image_url
构建方式
TalkMoves数据集通过从多个公开资源中收集的课堂录音和视频,经过人工转录和标注构建而成。该数据集包含567个K-12数学课堂的完整或部分课程转录,涵盖了全班讨论、小组活动以及部分在线课程。所有转录文本均由人工进行分段,并根据 accountable talk 理论在句子级别上标注了10种教师和学生的对话行为。此外,转录文本还包含了基于Switchboard Dialog Act Corpus的对话行为标签,以提供更丰富的语境信息。
使用方法
TalkMoves数据集可用于教育研究、政策制定以及开发智能教育技术。研究者可以通过分析教师和学生的对话行为,深入理解课堂互动的动态,并开发相应的教学反馈工具。此外,该数据集还可用于训练和验证自然语言处理模型,特别是那些旨在识别和分类课堂对话行为的模型。通过结合对话行为标签,研究者可以进一步探索对话行为与学习效果之间的关系,从而为教育实践提供科学依据。
背景与挑战
背景概述
TalkMoves数据集是由科罗拉多大学博尔德分校的计算机科学系和认知科学研究所的研究团队创建的,主要研究人员包括Abhijit Suresh、Jennifer Jacobs、Charis Harty等。该数据集包含了567个经过人工标注的K-12数学课堂的对话转录,涵盖了整个课程或部分课程的对话内容。这些转录主要来源于面对面的课堂讨论、小组工作以及部分在线课程。所有转录均基于‘负责任的对话’理论,对教师和学生的对话行为进行了句子级别的标注,旨在帮助教育者、政策制定者和研究者理解K-12数学课堂中的师生对话模式。该数据集的发布为研究课堂对话提供了宝贵的资源,并推动了智能教育技术的发展。
当前挑战
TalkMoves数据集在构建过程中面临了多个挑战。首先,课堂对话的复杂性使得对话行为的标注变得困难,尤其是需要区分教师和学生的不同对话行为。其次,数据集中的对话行为分布不均,某些对话行为(如‘提出数学问题’)出现的频率远高于其他行为,这为机器学习模型的训练带来了类别不平衡的问题。此外,由于课堂录音的隐私和伦理问题,获取和共享这些数据也面临诸多限制。最后,如何将这些标注数据有效地应用于实际教育场景,如通过TalkMoves应用程序为教师提供即时反馈,也是一个亟待解决的挑战。
常用场景
经典使用场景
TalkMoves数据集的经典使用场景主要集中在教育领域,尤其是K-12数学课堂中的教师和学生对话分析。该数据集通过详细标注的课堂对话转录,帮助研究者深入理解课堂中的对话模式,特别是基于‘负责任的对话’理论的‘对话动作’(talk moves)。这些标注包括教师和学生在课堂讨论中的具体行为,如提问、回应、解释等,为教育研究者提供了丰富的语言数据,用于分析和改进课堂教学策略。
解决学术问题
TalkMoves数据集解决了教育研究中关于课堂对话模式分析的常见问题。通过提供详细的对话动作标注,该数据集帮助研究者理解教师和学生在课堂中的互动方式,特别是如何通过对话促进学生的学习参与和知识建构。此外,该数据集还为开发智能教育技术提供了基础,支持教师通过自动化反馈改进教学实践,从而提升课堂讨论的质量和学生的学习效果。
实际应用
在实际应用中,TalkMoves数据集被用于开发TalkMoves应用程序,该应用为教师提供即时、自动化的反馈,帮助他们识别和改进课堂中的对话策略。通过分析课堂录音,应用程序能够检测教师和学生的对话动作,并生成个性化的反馈报告,帮助教师优化教学方法。此外,该数据集还可用于培训教育技术工具,支持教师在课堂中更好地组织和引导讨论,促进学生的积极参与和深度学习。
数据集最近研究
最新研究方向
TalkMoves数据集在教育领域的最新研究方向主要集中在利用自然语言处理(NLP)和机器学习技术,分析和优化课堂讨论中的教师和学生对话行为。该数据集通过注释教师和学生的‘对话行为’(talk moves),为研究者提供了深入理解课堂互动的宝贵资源。前沿研究不仅关注如何通过自动化工具(如TalkMoves应用程序)为教师提供即时反馈,还探索了如何利用这些数据训练AI模型,以预测未来的对话行为,从而进一步提升教学效果。此外,该数据集还被用于研究对话行为与对话行为标签之间的关系,以及如何将这些模型推广到其他学科领域,如科学课堂。这些研究不仅推动了教育技术的创新,也为构建更加公平和有效的学习环境提供了理论和实践支持。
相关研究论文
  • 1
    The TalkMoves Dataset: K-12 Mathematics Lesson Transcripts Annotated for Teacher and Student Discursive Moves科罗拉多大学博尔德分校计算机科学系与认知科学研究所 · 2022年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录

红外谱图数据库

收集整理红外谱图实验手册等数据,建成了红外谱图数据库。本数据库收录了常见化合物的红外谱图。主要包括化合物数据和对应的红外谱图数据。其中,原始红外谱图都进行了数字化处理,从而使谱峰检索成为可能。用户可以在数据库中检索指定化合物的谱图,也可以提交谱图/谱峰数据,以检索与之相似的谱图数据,以协助进行谱图鉴定。

国家基础学科公共科学数据中心 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

中国行政区划数据

本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。

github 收录