Qwen2.5-500M
收藏arXiv2025-09-30 收录
下载链接:
https://huggingface.co/models?search=Qwen2.5-500M
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个基于Transformer的预训练语言模型,拥有500M的参数,旨在提供通用的语言理解能力。此外,该模型具备32,768个标记的上下文窗口,以便更好地处理长文本信息。在规模上,该模型达到了500M参数的量级,主要任务是语言建模。
提供机构:
HuggingFace



