five

MiniMind 大模型训练微调数据集

收藏
超神经2025-03-10 更新2025-03-08 收录
下载链接:
https://hyper.ai/cn/datasets/38189
下载链接
链接失效反馈
官方服务:
资源简介:
MiniMind 是一个开源的轻量级大语言模型项目,旨在降低大语言模型 (LLM) 的使用门槛,使个人用户能够在普通设备上快速训练和推理。

MiniMind is an open-source lightweight large language model project that aims to lower the barrier to using Large Language Models (LLMs), enabling individual users to quickly conduct training and inference on ordinary devices.
创建时间:
2025-03-06
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
MiniMind是一个开源轻量级大语言模型项目,旨在降低大语言模型的使用门槛,使个人用户能在普通设备上训练和推理。该数据集整合了多个子数据集,包括分词器训练、预训练、监督微调和奖励模型数据,总量约3B token,适合中文大语言模型的预训练。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务