RECIPE4U
收藏github2024-05-18 更新2024-05-31 收录
下载链接:
https://github.com/zeunie/RECIPE4U
下载链接
链接失效反馈官方服务:
资源简介:
这是一个关于EFL写作教育中学生与ChatGPT交互的数据集,包含学生与ChatGPT之间的对话数据,用于研究和分析。
This dataset pertains to the interaction between students and ChatGPT in the context of EFL (English as a Foreign Language) writing education. It encompasses dialogue data between students and ChatGPT, intended for research and analysis purposes.
创建时间:
2023-11-10
原始信息汇总
数据集概述
数据集名称
RECIPE4U: Student-ChatGPT Interaction Dataset in EFL Writing Education
数据集属性
| 列名 | 类型 | 描述 |
|---|---|---|
| sample_id | String | 由student_id, course, week, session, idx组成的唯一标识符 |
| course | String | 学生所选课程信息,包括IRW, AW, SW |
| student_id | Integer | 学生标识号 |
| week | Integer | 对话发生的周数 |
| session | Integer | 周内对话的会话数 |
| idx | Integer | 会话内的话语编号 |
| chatgpt_before | String | 学生发言前ChatGPT的话语 |
| user | String | 学生收到ChatGPT回复后的发言 |
| chatgpt_after | String | 学生发言后ChatGPT的话语 |
| rating | Integer | 学生对ChatGPT回复的满意度评分,5点Likert量表 |
| intent_final | String | 根据学生发言标注的学生意图 |
| is_quiz | Boolean | 学生是否向ChatGPT询问测验答案 |
| is_essay_edit | Boolean | 学生是否在收到ChatGPT回复后编辑其论文 |
| essay | String | 学生的书面论文 |
数据集统计
| 统计项 | 数量 |
|---|---|
| 对话数量 | 504 |
| 总话语数 | 4,330 |
| 总令牌数 | 380,364 |
| 唯一令牌数 | 16,118 |
语言
- 英语
- 韩语
下载方式
- 需提交同意书,审核后通过电子邮件发送数据集链接。
使用限制
- 仅限于研究目的,禁止任何恶意使用。
搜集汇总
数据集介绍

构建方式
RECIPE4U数据集的构建基于学生在英语作为外语(EFL)写作教育中的实际互动。该数据集收集了学生与ChatGPT在不同课程(如中级阅读与写作、高级写作和科学写作)中的对话,涵盖了多个周次和会话。每个对话样本包含学生的唯一标识、课程信息、周次、会话编号、对话内容、ChatGPT的响应、学生的自我评价以及学生的写作意图等详细信息。此外,数据集还记录了学生是否在对话后对作文进行了编辑或是否询问了测验答案。
特点
RECIPE4U数据集的显著特点在于其多维度的信息记录,不仅包括对话内容,还涵盖了学生的自我评价、写作意图以及对话后的行为反馈。数据集中的对话样本数量达到504个,总话语数为4,330条,总词汇量为380,364个,其中独特词汇量为16,118个。此外,数据集支持英语和韩语两种语言,为跨语言研究提供了丰富的资源。
使用方法
使用RECIPE4U数据集前,用户需提交同意书以获取访问权限。该数据集适用于研究学生在EFL写作教育中的互动行为、ChatGPT的响应效果以及学生的自我评价和写作意图。研究者可以通过分析对话内容、学生的自我评价和写作意图,探索ChatGPT在教育场景中的应用效果。此外,数据集还支持跨语言研究,为多语言环境下的教育技术研究提供了宝贵的数据支持。
背景与挑战
背景概述
RECIPE4U数据集由Han, Jieun等人于2024年创建,旨在探索和分析非母语英语学习(EFL)写作教育中学生与ChatGPT的交互对话。该数据集的核心研究问题聚焦于如何通过人工智能辅助工具提升学生的写作能力,并评估学生对ChatGPT反馈的满意度。RECIPE4U不仅为EFL写作教育提供了新的研究视角,还为人工智能在教育领域的应用提供了宝贵的实证数据。该数据集的发布标志着教育技术与自然语言处理领域的深度融合,对推动个性化学习与智能教育的发展具有重要意义。
当前挑战
RECIPE4U数据集在构建过程中面临多重挑战。首先,如何确保学生与ChatGPT交互的自然性与有效性,以真实反映学生在写作过程中的需求与困惑,是一个关键问题。其次,数据集中包含的学生作文涉及隐私与伦理问题,确保数据的安全性与合规性成为另一大挑战。此外,如何准确标注学生的意图(intent_final)并评估其对ChatGPT反馈的满意度(rating),也需要精细的标注与验证过程。最后,数据集的多样性,涵盖英语与韩语两种语言,增加了跨语言分析的复杂性。
常用场景
经典使用场景
RECIPE4U数据集在英语作为外语(EFL)写作教育领域中展现了其经典应用场景。该数据集通过记录学生与ChatGPT之间的交互对话,提供了丰富的语料资源,特别适用于研究学生在写作过程中如何利用AI辅助工具进行内容生成、语法修正及意图表达。通过分析这些对话,研究者能够深入理解学生在写作任务中的需求与挑战,进而优化AI助手的响应策略,提升写作教学的效率与质量。
解决学术问题
RECIPE4U数据集在学术研究中解决了多个关键问题。首先,它为研究者提供了学生在EFL写作教育中与AI交互的详实数据,有助于探索AI在教育领域的应用潜力。其次,通过分析学生的自我评价与对话内容,研究者能够评估AI助手的有效性,并提出改进建议。此外,该数据集还为研究学生写作意图的识别与分类提供了宝贵的语料,推动了自然语言处理技术在教育领域的深入应用。
衍生相关工作
RECIPE4U数据集的发布催生了一系列相关研究工作。研究者利用该数据集开发了多种AI写作辅助工具,如智能语法检查器和写作意图识别系统,这些工具在教育实践中得到了广泛应用。此外,基于该数据集的研究还推动了对话系统在教育领域的深入探索,特别是在个性化学习路径的构建和学生写作能力的评估方面。这些衍生工作不仅丰富了教育技术领域,也为未来的研究提供了新的方向。
以上内容由遇见数据集搜集并总结生成



