Fizzarolli/wtf-is-wrong-with-composer
收藏Hugging Face2024-07-14 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Fizzarolli/wtf-is-wrong-with-composer
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含用于自然语言处理任务的序列数据,主要特征包括输入ID序列(input_ids)、注意力掩码序列(attention_mask)和标签序列(labels)。数据集分为训练集和测试集,训练集包含1782个样本,测试集包含198个样本。数据集的下载大小为2722207字节,总大小为26405280字节。
This dataset contains sequence data for natural language processing tasks, with main features including input ID sequences (input_ids), attention mask sequences (attention_mask), and label sequences (labels). The dataset is divided into a training set and a test set, with 1782 samples in the training set and 198 samples in the test set. The download size of the dataset is 2722207 bytes, and the total size is 26405280 bytes.
提供机构:
Fizzarolli
原始信息汇总
数据集概述
特征
- input_ids: 序列类型,数据类型为int32。
- attention_mask: 序列类型,数据类型为int8。
- labels: 序列类型,数据类型为int64。
数据分割
- train: 包含1782个样本,大小为23764752.0字节。
- test: 包含198个样本,大小为2640528.0字节。
数据集大小
- 下载大小: 2722207字节。
- 总数据集大小: 26405280.0字节。
配置
- default:
- train: 数据路径为
data/train-*。 - test: 数据路径为
data/test-*。
- train: 数据路径为



