mistral-7B-v0.1
收藏academictorrents.com2025-03-21 收录
下载链接:
https://academictorrents.com/details/208b101a0f51514ecf285885a8b0f6fb1a1e4d7d
下载链接
链接失效反馈官方服务:
资源简介:
Mistral 7B is a 7.3B parameter model that: - Outperforms Llama 2 13B on all benchmarks - Outperforms Llama 1 34B on many benchmarks - Approaches CodeLlama 7B performance on code, while remaining good at English tasks - Uses Grouped-query attention (GQA) for faster inference - Uses Sliding Window Attention (SWA) to handle longer sequences at smaller cost - We’re releasing Mistral 7B under the Apache 2.0 license, it can be used without restrictions. ▄▄▄░░ ▄▄▄▄▄█████████░░░░ ▄▄▄▄▄▄████████████████████░░░░░ █████████████████████████████░░░░░ ▄▄▄▄▄▄█████░░░ █████████████████████████████░░░░░ ▄▄▄▄▄██████████████████░░░░░░ ███████████
Mistral 7B是一款参数量为7.3亿的模型,具备以下特点:
- 在所有基准测试中均超越Llama 2 13B模型的表现
- 在许多基准测试中超越Llama 1 34B模型的表现
- 在代码任务上接近CodeLlama 7B的性能,同时在英语任务上仍保持出色表现
- 采用分组查询注意力(Grouped-query attention,简称GQA)以实现更快的推理速度
- 利用滑动窗口注意力(Sliding Window Attention,简称SWA)以较低的成本处理更长的序列
- 我们将Mistral 7B以Apache 2.0许可协议形式发布,允许无限制使用。 ▄▄▄░░ ▄▄▄▄▄█████████░░░░ ▄▄▄▄▄▄████████████████████░░░░░ █████████████████████████████░░░░░ ▄▄▄▄▄▄█████░░░ █████████████████████████████░░░░░ ▄▄▄▄▄██████████████████░░░░░░ ███████████
提供机构:
academictorrents.com



