marsggbo/bigbench4switch32_pattern_predictor
收藏Hugging Face2024-05-26 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/marsggbo/bigbench4switch32_pattern_predictor
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如prompt_text、prompt_ids、decode_ids、prompt_pattern和decode_pattern。这些特征的数据类型包括字符串和序列。数据集只有一个训练集分割,包含32808个样本,总大小为483379455字节。prompt_pattern表示在encoder第一个moe层激活的expert索引值。
This dataset is primarily used for natural language processing tasks, featuring multiple attributes such as prompt text, prompt IDs, decode IDs, prompt pattern, and decode pattern. The dataset is divided into a training set with 32808 samples, totaling 483379455 bytes. Each feature has its specific data type and structure, for example, the values in prompt pattern indicate the activated expert indices at specific layers of the encoder.
提供机构:
marsggbo
原始信息汇总
数据集概述
数据集特征
- prompt_text:字符串类型。
- prompt_ids:序列类型,数据类型为int64。
- decode_ids:序列类型,数据类型为int64。
- prompt_pattern:序列类型,内部序列数据类型为int64。
- decode_pattern:序列类型,内部序列数据类型为int64。
数据集划分
- train:
- 数据量:483379455字节
- 示例数量:32808
数据集大小
- 下载大小:46650593字节
- 数据集大小:483379455字节
配置
- default:
- 数据文件路径:
data/train-*
- 数据文件路径:



