five

chimera-v0.1.0

收藏
Hugging Face2026-05-08 更新2026-05-09 收录
下载链接:
https://huggingface.co/datasets/specimba/chimera-v0.1.0
下载链接
链接失效反馈
官方服务:
资源简介:
Chimera v0.1.1是一个面向NEXUS操作系统的压缩感知模型路由器,主要用于在资源受限环境下(如边缘设备)进行高效模型选择和推理。该项目涉及多种压缩和量化技术(包括1-bit量化、TWAVE SVD+WHT等),并维护了包含不同压缩级别模型的资源池(ECO/FAST/MID/PREMIUM)。这些模型池根据VRAM需求(2GB-24GB+)、压缩方法(如Bonsai 1.7B-8B、TWAVE int2-int4)和使用场景(嵌入式边缘设备到服务器/云)进行分类组织。项目规模小于1K,适用于边缘推理、模型压缩和资源感知路由等任务场景。

Chimera v0.1.1 is a compressed sensing model router for the NEXUS operating system, primarily used for efficient model selection and inference in resource-constrained environments (such as edge devices). The project involves various compression and quantization techniques (including 1-bit quantization, TWAVE SVD+WHT, etc.) and maintains a resource pool of models with different compression levels (ECO/FAST/MID/PREMIUM). These model pools are organized based on VRAM requirements (2GB-24GB+), compression methods (e.g., Bonsai 1.7B-8B, TWAVE int2-int4), and use cases (from embedded edge devices to servers/cloud). The project size is less than 1K and is suitable for tasks such as edge inference, model compression, and resource-aware routing.
创建时间:
2026-05-01
原始信息汇总

Chimera v0.1.1 数据集概述

基本信息

  • 语言: 英语(en)
  • 许可证: Apache-2.0
  • 标签: 压缩、量化、大语言模型、路由器、Nexus-OS、Bonsai、T-wave、1-bit、边缘推理
  • 数据集规模: n<1K(小于1000个样本)

核心功能

Chimera 是一个压缩感知模型路由器,专为 NEXUS OS 设计,能够根据代理意图、token预算、延迟 SLA 和显存限制等因素,智能选择最优的压缩模型。

路由选择示例

路由器根据以下参数进行模型选择:

  • agent_id: 代理标识
  • intent: 意图描述(如“编写Python函数”)
  • token_budget: Token预算
  • latency_sla_ms: 延迟服务等级协议(毫秒)
  • vram_mb: 可用显存(MB)

返回结果包含:

  • model_id: 选定模型标识(如 prism-ml/Bonsai-8B-gguf)
  • compression: 压缩方法(如 bonsai_1bit)
  • pool: 所属资源池(如 FAST)

系统架构

chimera/ ├── bridge/ # Hermes → Chimera 集成 │ └── hermes_chimera.py ├── core/ # 核心组件 │ ├── compression_registry.py # SQLite元数据存储 │ ├── chimera_router.py # 池感知选择 │ └── memory_tracks.py # 压缩历史(第6轨道) ├── plugins/ # 压缩方法插件 │ ├── bonsaiturtle/ # Bonsai打包提供者 │ ├── twave/ # TWAVE(SVD+WHT)提供者 │ └── bitnet/ # 未来:微软BitNet ├── packs/ ├── benchmarks/ └── tests/

资源池(Pools)

资源池 显存需求 压缩方法 适用场景
ECO 2-4GB TWAVE int2、Bonsai 1.7B 嵌入式设备、边缘设备
FAST 4-8GB Bonsai 4B/8B、TWAVE int3 消费级笔记本
MID 8-24GB Q4/Q6 GGUF、TWAVE int4 工作站
PREMIUM 24GB以上 FP16、MoE 服务器/云端

使用方式

测试命令

bash python chimera/tests/test_chimera.py python chimera/tests/test_hermes_bridge.py

PowerShell启动器

powershell .launch-chimera.ps1 -Profile fast

搜集汇总
数据集介绍
main_image_url
构建方式
Chimera v0.1.1 数据集依托于 NEXUS OS 生态系统构建,旨在实现对大型语言模型的高效压缩与路由管理。其核心架构由桥接层、核心模块及插件体系组成,其中桥接层实现了 Hermes 至 Chimera 的集成,核心模块则包含了基于 SQLite 的压缩元数据存储库(CompressionRegistry)、感知池化的模型选择器(ChimeraRouter)以及第六轨道的压缩历史追踪组件(MemoryTracks)。插件部分提供了 Bonsai 压缩包提供器、TWAVE 奇异值分解与沃尔什-哈达玛变换提供器,并为未来集成微软 BitNet 预留了接口。该数据集通过分层设计,将模型按 VRAM 需求划分为 ECO、FAST、MID 和 PREMIUM 四个资源池,每个池对应不同的压缩方法与使用场景,从而构建出多维度、可扩展的模型路由体系。
特点
该数据集的核心特色在于其压缩感知的路由选择能力,能够根据代理标识符、用户意图、令牌预算、延迟服务等级协议及显存容量等多元约束,动态遴选最优模型与压缩策略。其资源池划分精细,ECO 池专为嵌入式与边缘设备设计,支持 TWAVE int2 与 Bonsai 1.7B 模型;FAST 池面向消费级笔记本,兼容 Bonsai 4B/8B 及 TWAVE int3;MID 池服务于工作站,支持 Q4/Q6 GGUF 与 TWAVE int4;PREMIUM 池则面向服务器与云端,提供 FP16 及混合专家模型。此外,数据集集成了 TWAVE 的整数量化与 Bonsai 的 1 比特压缩方法,并通过压缩历史追踪机制实现动态优化。
使用方法
使用时,用户首先通过 CompressionRegistry 初始化压缩注册表,随后实例化 ChimeraRouter 路由对象。调用 select 方法时,需传入代理标识符、意图描述、令牌预算、延迟服务等级协议阈值及显存容量等参数,系统将自动返回包含模型标识符、压缩策略及资源池信息的选定结果。开发者可通过命令行运行单元测试验证功能完整性,亦可利用 PowerShell 启动器指定 profile 参数(如 fast)快速部署。该数据集支持通过 pip 安装,并提供了清晰的 Python 接口,便于集成至现有推理管线,实现对大模型在资源受限设备上的高效部署与智能调度。
背景与挑战
背景概述
Chimera v0.1.0 数据集发布于2024年,由NEXUS OS团队主导研发,旨在解决大语言模型在边缘设备上高效推理的路径选择问题。核心研究围绕压缩感知路由机制展开,通过整合Bonsai、TWAVE等混合量化方法,为不同计算资源等级的设备动态分配最优模型。该数据集填补了模型压缩与运行时调度之间缺乏标准化评估基准的空白,在1-bit量化推理与异构设备协同领域具有开创性影响力,为未来边缘AI系统提供了可复现的决策依据。
当前挑战
当前面临的主要挑战包括:1) 模型压缩精度与推理速度的权衡难题,如Bonsai的1-bit量化在保持任务性能的同时需避免过度退化;2) 资源池划分的边界模糊性,ECO与FAST池的VRAM阈值划分可能不适用于所有硬件配置;3) 构建过程中量化方法注册表的维护困难,TWAVE SVD+WHT与BitNet等异构压缩技术的兼容性测试缺乏统一规范。
常用场景
经典使用场景
在大型语言模型(LLM)推理与边缘部署的交叉领域中,Chimera v0.1.0 作为一个压缩感知模型路由器,其经典使用场景在于根据任务意图、令牌预算、延迟约束及显存容量等动态条件,从多种量化与压缩策略池中智能选择最优模型变体。该路由器通过对 Bonsai、TWAVE 等压缩方法的统一编排,实现了从嵌入式设备到云端服务器的分层部署,使得 LLM 在资源受限环境下依然能够高效运行,兼顾推理速度与模型精度。
解决学术问题
Chimera 数据集及相关系统解决了 LLM 部署中量化策略选择与异构硬件适配的经典学术难题。现有研究多聚焦于单一压缩方法的效果评估,但缺乏统一的跨方法、跨场景决策框架。Chimera 通过引入压缩感知路由机制,填补了模型压缩与运行时资源调度之间的鸿沟,为边缘推理、实时交互等场景提供了可复现的基准与系统化解决方案。其意义在于推动了 LLM 高效部署从静态配置向动态自适应演进的范式转变。
衍生相关工作
基于 Chimera 的设计思想,衍生了一系列关于压缩感知模型选择与多策略量化整合的创新工作。其中,Hermes → Chimera 集成桥接模块使得与更广泛的 LLM 编排系统对接成为可能;而 COMPRESSION_HISTORY 第六迹内存跟踪机制则催生了关于量化策略自适应回滚与性能预测的研究。此外,BitNet 等 1 比特预训练模型的耦合探索,也受到了 Chimera 所定义的分层池化与准入标准的启发,进一步拓展了超低比特量化在网络边缘端的部署边界。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作