salahyahya/grammeranderrordataset

Name: salahyahya/grammeranderrordataset
Creator: salahyahya
Published: 2024-06-20 00:53:01
License: 暂无描述

Hugging Face2024-06-20 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/salahyahya/grammeranderrordataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含12976个样本，主要用于文本处理任务。每个样本包含四个特征：essay_id（文章ID）、word_count（单词数量）、input（输入文本）和output（输出文本）。数据集仅包含一个训练集分割，总大小为31842584字节。

This dataset contains 12976 samples, primarily used for text processing tasks. Each sample includes four features: essay_id (essay ID), word_count (word count), input (input text), and output (output text). The dataset includes only one training split, with a total size of 31842584 bytes.

提供机构：

salahyahya

原始信息汇总

数据集概述

数据集特征

essay_id: 整数类型，表示文章的唯一标识符。
word_count: 整数类型，表示文章的字数。
input: 字符串类型，表示输入数据。
output: 字符串类型，表示输出数据。

数据集分割

train: 训练集，包含12976个样本，总大小为31842584字节。

数据集大小

下载大小: 16594400字节
数据集总大小: 31842584字节

配置

default: 默认配置，包含训练集数据文件，路径为data/train-*。

5,000+

优质数据集

54 个

任务类型

进入经典数据集