nics-efc/R2R_Router_Training_Qwen3-0.6B_Qwen3-30B-A3B
收藏Hugging Face2025-12-22 更新2026-01-03 收录
下载链接:
https://hf-mirror.com/datasets/nics-efc/R2R_Router_Training_Qwen3-0.6B_Qwen3-30B-A3B
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: token_id
dtype: int64
- name: data_id
dtype: int64
- name: divergent
dtype: int64
- name: small_token
dtype: int64
- name: real_token
dtype: int64
- name: small_logits
list: float32
- name: small_indices
list: int64
- name: small_last_hidden_states
list: float32
- name: mismatch
dtype: int64
- name: mask
dtype: int64
splits:
- name: train
num_bytes: 117694833588
num_examples: 21941617
- name: test
num_bytes: 9472357332
num_examples: 1765913
download_size: 57088334304
dataset_size: 127167190920
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
---
数据集信息:
特征字段:
- 名称:词元(Token)ID,数据类型:int64
- 名称:数据ID,数据类型:int64
- 名称:分歧标记,数据类型:int64
- 名称:小模型词元(Token),数据类型:int64
- 名称:真实词元(Token),数据类型:int64
- 名称:小模型对数概率(small_logits),数据类型:float32类型列表
- 名称:小模型索引(small_indices),数据类型:int64类型列表
- 名称:小模型最终隐状态(small_last_hidden_states),数据类型:float32类型列表
- 名称:不匹配标记,数据类型:int64
- 名称:掩码标记,数据类型:int64
数据集拆分:
- 拆分名称:训练集(train),字节数:117694833588,样本数量:21941617
- 拆分名称:测试集(test),字节数:9472357332,样本数量:1765913
下载总大小:57088334304,数据集总存储大小:127167190920
配置项:
- 配置名称:默认配置(default),数据文件路径:
- 训练集划分:对应路径为data/train-*
- 测试集划分:对应路径为data/test-*
提供机构:
nics-efc



