kimi-k2.6-reap-observations-v1
收藏Kimi-K2.6 REAP Observation Data (v1) 数据集详情
数据集概述
该数据集包含从 moonshotai/Kimi-K2.6 模型通过 REAP 逐层观察器捕获的每层专家路由和激活统计数据。它不是一个剪枝后的模型,而是完整的 REAP 校准过程的观察输出。
基本信息
| 属性 | 内容 |
|---|---|
| 数据集名称 | Kimi-K2.6 REAP Observation Data (v1) |
| 许可证 | Apache-2.0 |
| 任务类别 | 文本生成 |
| 语言 | 英语 |
| 数据集大小 | 1000万 ~ 1亿 条记录 |
| 标签 | mixture-of-experts, moe, reap, expert-pruning, kimi-k2, deepseek-v3, int4, compressed-tensors |
内容说明
每条记录描述了基础模型中每个 MoE 层的逐 token 路由决策、专家激活范数以及 REAP 重要性成分。下游用户可以将这些观察结果反馈到 reap.prune 中,以任意压缩比生成剪枝后的检查点,而无需重新运行昂贵的正向传播校准。
源模型信息
- 基础模型:
moonshotai/Kimi-K2.6(DeepseekV3 架构,约 1.026 万亿参数) - 量化方式: INT4,组大小 32,对称量化,使用
compressed-tensors的pack-quantized格式。密集 MLP 和注意力层按照模型的quantization_config.ignore列表保持 BF16 格式。
校准数据集
- 复合数据集 1:
0xSero/reap-calibration-data-v1— 包含来自 10 个领域的 23,088 个无基准样本 - 复合数据集 2:
0xSero/structured-outputs-calibration-v1— 包含 430 个 JSON/Mermaid 结构化输出样本
REAP 校准参数
依据论文对于 ≥110B 参数模型的推荐设置:
max_tokens=16384batch_size=8observation_sequence_chunk_size=1renormalize_router_weights=trueobserver=layerwise
仓库目录结构
runs/kimi-k26-pr17-obs-v1/ layerwise_intermediate/ group_000/ block_000_metrics.pt block_001_metrics.pt ... group_001/ ... complete_state.pt # 所有块×组处理完成后合并的观察器状态 status.json # 当前进度 / 最后块 / 最后组 / 预计完成时间 mix-summary.json # 校准数据混合清单 README.md # 本文件
每个 block_NNN_metrics.pt 在 REAP 逐层观察器完成写入后即会上传,因此部分运行结果也可直接使用。最终合并的 complete_state.pt 在整个扫描完成后推送。
数据使用示例
加载完整的观察器状态数据: python from huggingface_hub import snapshot_download import torch
path = snapshot_download( repo_id="0xSero/kimi-k2.6-reap-observations-v1", repo_type="dataset", allow_patterns=["runs/kimi-k26-pr17-obs-v1/complete_state.pt"], ) observer_data = torch.load(f"{path}/runs/kimi-k26-pr17-obs-v1/complete_state.pt", weights_only=False)
返回的数据结构(按层级索引):
expert_frequency: Tensor[num_experts] — 专家频率routed_characteristic_activation: Tensor[num_experts, hidden_dim] — 路由特征激活ttm_similarity_matrix: — TTM 相似性矩阵reap: Tensor[num_experts] — 预计算的 REAP 重要性分数
使用要求
如果使用该数据集,请引用 REAP 论文及本数据集版本。许可证为 Apache-2.0(与上游 REAP 一致),基础模型许可证遵循 moonshotai/Kimi-K2.6 的条款。




