chimera-v0.1.0
收藏Chimera v0.1.1 数据集概述
基本信息
- 语言: 英语(en)
- 许可证: Apache-2.0
- 标签: 压缩、量化、大语言模型、路由器、Nexus-OS、Bonsai、T-wave、1-bit、边缘推理
- 数据集规模: n<1K(小于1000个样本)
核心功能
Chimera 是一个压缩感知模型路由器,专为 NEXUS OS 设计,能够根据代理意图、token预算、延迟 SLA 和显存限制等因素,智能选择最优的压缩模型。
路由选择示例
路由器根据以下参数进行模型选择:
- agent_id: 代理标识
- intent: 意图描述(如“编写Python函数”)
- token_budget: Token预算
- latency_sla_ms: 延迟服务等级协议(毫秒)
- vram_mb: 可用显存(MB)
返回结果包含:
- model_id: 选定模型标识(如 prism-ml/Bonsai-8B-gguf)
- compression: 压缩方法(如 bonsai_1bit)
- pool: 所属资源池(如 FAST)
系统架构
chimera/ ├── bridge/ # Hermes → Chimera 集成 │ └── hermes_chimera.py ├── core/ # 核心组件 │ ├── compression_registry.py # SQLite元数据存储 │ ├── chimera_router.py # 池感知选择 │ └── memory_tracks.py # 压缩历史(第6轨道) ├── plugins/ # 压缩方法插件 │ ├── bonsaiturtle/ # Bonsai打包提供者 │ ├── twave/ # TWAVE(SVD+WHT)提供者 │ └── bitnet/ # 未来:微软BitNet ├── packs/ ├── benchmarks/ └── tests/
资源池(Pools)
| 资源池 | 显存需求 | 压缩方法 | 适用场景 |
|---|---|---|---|
| ECO | 2-4GB | TWAVE int2、Bonsai 1.7B | 嵌入式设备、边缘设备 |
| FAST | 4-8GB | Bonsai 4B/8B、TWAVE int3 | 消费级笔记本 |
| MID | 8-24GB | Q4/Q6 GGUF、TWAVE int4 | 工作站 |
| PREMIUM | 24GB以上 | FP16、MoE | 服务器/云端 |
使用方式
测试命令
bash python chimera/tests/test_chimera.py python chimera/tests/test_hermes_bridge.py
PowerShell启动器
powershell .launch-chimera.ps1 -Profile fast




