five

mistral-7B-v0.1

收藏
academictorrents.com2025-03-21 收录
下载链接:
https://academictorrents.com/details/208b101a0f51514ecf285885a8b0f6fb1a1e4d7d
下载链接
链接失效反馈
官方服务:
资源简介:
Mistral 7B is a 7.3B parameter model that: - Outperforms Llama 2 13B on all benchmarks - Outperforms Llama 1 34B on many benchmarks - Approaches CodeLlama 7B performance on code, while remaining good at English tasks - Uses Grouped-query attention (GQA) for faster inference - Uses Sliding Window Attention (SWA) to handle longer sequences at smaller cost - We’re releasing Mistral 7B under the Apache 2.0 license, it can be used without restrictions. ▄▄▄░░ ▄▄▄▄▄█████████░░░░ ▄▄▄▄▄▄████████████████████░░░░░ █████████████████████████████░░░░░ ▄▄▄▄▄▄█████░░░ █████████████████████████████░░░░░ ▄▄▄▄▄██████████████████░░░░░░ ███████████

Mistral 7B是一款参数量为7.3亿的模型,具备以下特点: - 在所有基准测试中均超越Llama 2 13B模型的表现 - 在许多基准测试中超越Llama 1 34B模型的表现 - 在代码任务上接近CodeLlama 7B的性能,同时在英语任务上仍保持出色表现 - 采用分组查询注意力(Grouped-query attention,简称GQA)以实现更快的推理速度 - 利用滑动窗口注意力(Sliding Window Attention,简称SWA)以较低的成本处理更长的序列 - 我们将Mistral 7B以Apache 2.0许可协议形式发布,允许无限制使用。 ▄▄▄░░ ▄▄▄▄▄█████████░░░░ ▄▄▄▄▄▄████████████████████░░░░░ █████████████████████████████░░░░░ ▄▄▄▄▄▄█████░░░ █████████████████████████████░░░░░ ▄▄▄▄▄██████████████████░░░░░░ ███████████
提供机构:
academictorrents.com
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作