nanotron/llama3_needle_16k_finetuning
收藏Hugging Face2024-06-15 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/nanotron/llama3_needle_16k_finetuning
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含3570个训练样本,每个样本具有id、prompt、answer、context_length和depth_percent五个特征。id和prompt为字符串类型,answer、context_length和depth_percent为整数类型。数据集总大小为262570192字节,下载大小为15822821字节。数据集的默认配置文件指定了数据文件路径为data/train-*。
The dataset contains 3570 training samples, each with five features: id, prompt, answer, context_length, and depth_percent. The id and prompt are of string type, while answer, context_length, and depth_percent are of integer type. The total size of the dataset is 262570192 bytes, with a download size of 15822821 bytes. The default configuration file of the dataset specifies the data file path as data/train-*.
提供机构:
nanotron
原始信息汇总
数据集概述
数据集信息
特征
- id: 字符串类型
- prompt: 字符串类型
- answer: 64位整数类型
- context_length: 64位整数类型
- depth_percent: 64位整数类型
数据分割
- train:
- 字节数: 262570192
- 样本数: 3570
数据集大小
- 下载大小: 15822821 字节
- 数据集大小: 262570192 字节
配置
- default:
- 数据文件:
- 分割: train
- 路径: data/train-*
- 数据文件:



