llm-aes/asappp-1-2-original

Name: llm-aes/asappp-1-2-original
Creator: llm-aes
Published: 2024-01-14 02:57:26
License: 暂无描述

Hugging Face2024-01-14 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/llm-aes/asappp-1-2-original

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含与文章评分相关的多个特征，如文章集编号、文章内容、评分者1的评分、评分者2的评分、最终评分、评分标准、写作提示、内容评分、组织结构评分、词汇选择评分、句子流畅度评分和语法规范评分等。数据集分为训练集，包含3583个样本，文件大小为14489590字节。

提供机构：

llm-aes

原始信息汇总

数据集概述

数据特征

essay_set: 整数类型
essay: 字符串类型
rater1_domain1: 整数类型
rater2_domain1: 整数类型
domain1_score: 整数类型
rubrics: 字符串类型
prompt: 字符串类型
content: 整数类型
organization: 整数类型
word_choice: 整数类型
sentence_fluency: 整数类型
conventions: 整数类型
index_level_0: 整数类型

数据分割

train: 包含3583个样本，占用14489590字节

数据集大小

下载大小: 4033411字节
数据集大小: 14489590字节

配置

default: 包含训练数据文件路径为data/train-*

搜集汇总

数据集介绍

构建方式

在自动作文评分领域，ASAP++数据集通过整合美国标准化考试中的学生作文构建而成。该数据集收录了不同题目下的数千篇作文，每篇作文由两位评分员依据统一的评分标准进行独立评分，并最终计算得出综合分数。数据采集过程严格遵循教育评估规范，确保了评分的客观性与一致性，为后续研究提供了高质量的标注数据。

特点

ASAP++数据集以其多维度的评分体系著称，不仅包含整体分数，还细分为内容、组织、词汇选择、句子流畅性和语法规范等五个子维度。这种精细的标注方式使得研究者能够深入分析作文质量的具体构成要素。数据集覆盖了多样化的作文题目和难度级别，反映了真实教育场景中的评估需求，为模型训练提供了丰富的语义和结构信息。

使用方法

该数据集适用于训练和评估自动作文评分模型，用户可直接加载训练集进行模型开发。在使用时，建议将作文文本作为输入特征，综合分数或各维度分数作为预测目标，结合提示信息和评分细则以增强模型的可解释性。数据集的标准化格式便于与主流机器学习框架集成，支持自然语言处理任务中的监督学习与对比分析。

背景与挑战

背景概述

在自然语言处理与教育评估交叉领域，自动作文评分（Automated Essay Scoring, AES）技术旨在通过计算模型对文本质量进行量化评估，以辅助或替代人工评分。llm-aes/asappp-1-2-original数据集由相关研究机构构建，聚焦于解决作文自动评分的核心研究问题，即如何基于多维评分标准（如内容、组织、语言运用等）实现准确、一致的分数预测。该数据集的创建推动了AES模型的发展，为教育技术中的个性化反馈与大规模评估提供了重要数据基础，增强了评分效率与客观性。

当前挑战

该数据集面临的挑战主要体现在两方面：其一，在领域问题层面，作文评分涉及主观性与语义复杂性，模型需克服评分标准模糊性、文化语境差异及创造性表达识别等难题，以实现与人工评分者相近的判别能力；其二，在构建过程中，数据收集需确保评分者间一致性，处理多维度评分标签的整合，并维护文本数据的多样性与代表性，这些因素均增加了数据集构建的复杂性与质量控制难度。

常用场景

经典使用场景

在自动作文评分领域，asappp-1-2-original数据集为研究者提供了丰富的文本评估资源。该数据集收录了多篇学生作文，并附有详细的评分维度，如内容、组织结构和语言规范等，使得模型能够学习人类评分员的评判标准。通过分析这些标注数据，机器学习算法可以模拟专家评分过程，实现对学生写作质量的自动化评估，从而在教育技术中发挥重要作用。

解决学术问题

该数据集有效解决了自然语言处理中自动作文评分的核心挑战，即如何准确量化文本质量并保持一致的评价标准。它通过提供多维度评分和详细评分细则，帮助研究者开发更精确的评分模型，减少人工评分的主观偏差。这不仅提升了评分效率，还为教育公平性研究提供了数据支持，推动了智能教育评估系统的发展。

衍生相关工作

基于asappp-1-2-original数据集，学术界衍生出多项经典研究，例如开发基于深度学习的自动评分模型，这些模型利用注意力机制和Transformer架构提升评分准确性。相关研究还探索了多任务学习框架，同时预测作文的多个评分维度，进一步优化了评估效果。这些工作不仅推动了自动评分技术的发展，还为后续数据集如ASAP++的构建提供了重要参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集