sade-adrien/quantization_samples
收藏Hugging Face2024-04-08 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/sade-adrien/quantization_samples
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于GPTQ量化的校准,包含128个样本,每个样本有2048个token,这些样本来自RedPajama-2数据集。数据集的特征包括raw_content、doc_id、meta和quality_signals,均为字符串类型。数据集只有一个训练集分割,大小为57463236字节,包含128个样本。
该数据集用于GPTQ量化的校准,包含128个样本,每个样本有2048个token,这些样本来自RedPajama-2数据集。数据集的特征包括raw_content、doc_id、meta和quality_signals,均为字符串类型。数据集只有一个训练集分割,大小为57463236字节,包含128个样本。
提供机构:
sade-adrien
原始信息汇总
数据集概述
数据集名称
Calibration dataset for quantization with GPTQ.
数据集详情
- 样本数量:128个样本
- 样本特征:每个样本包含2048个token
- 数据来源:RedPajama-2数据集
数据结构
- 特征:
raw_content:数据类型为字符串doc_id:数据类型为字符串meta:数据类型为字符串quality_signals:数据类型为字符串
数据分割
- 训练集:
- 大小:57463236字节
- 样本数量:128个样本
数据集大小
- 下载大小:27262211字节
- 数据集总大小:57463236字节



