llama2d/llama2d-unscramble-small

Name: llama2d/llama2d-unscramble-small
Creator: llama2d
Published: 2023-10-07 02:17:35
License: 暂无描述

Hugging Face2023-10-07 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/llama2d/llama2d-unscramble-small

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: input_ids sequence: float32 - name: coords sequence: sequence: float32 - name: labels sequence: float32 - name: attention_mask sequence: float32 splits: - name: train num_bytes: 30080000 num_examples: 5000 download_size: 1614133 dataset_size: 30080000 configs: - config_name: default data_files: - split: train path: data/train-* --- # Dataset Card for "llama2d-unscramble-small" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

--- 数据集信息：特征： - 名称：输入Token ID（input_ids），序列数据类型为float32 - 名称：坐标（coords），序列为嵌套结构，内层序列数据类型为float32 - 名称：标签（labels），序列数据类型为float32 - 名称：注意力掩码（attention_mask），序列数据类型为float32 数据集划分： - 划分名称：训练集（train），占用字节数：30080000，样本数量：5000 下载大小：1614133 数据集总大小：30080000 配置项： - 配置名称：默认配置（default），数据文件： - 对应划分：训练集，路径：data/train-* --- # 「llama2d-unscramble-small」数据集卡片 [需补充更多相关信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

llama2d

原始信息汇总

数据集概述

数据集信息

特征

input_ids: 序列类型，数据类型为 float32
coords: 嵌套序列类型，数据类型为 float32
labels: 序列类型，数据类型为 float32
attention_mask: 序列类型，数据类型为 float32

数据分割

train: 包含 5000 个样本，总字节数为 30080000

数据大小

下载大小: 1614133 字节
数据集大小: 30080000 字节

配置

default: 包含训练数据文件，路径为 data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集