CollectiveSFT
收藏CollectiveSFT
概述
CollectiveSFT 是一个用于中文医疗基准测试的大型语言模型,通过集体指令在医疗保健领域进行扩展。
预处理
在 preprocess 文件夹中,包含了将数据集转换为 Alpaca 格式的所有转换脚本。使用这些脚本前,请注意可能需要申请访问某些数据集。
训练
训练配置文件位于 train 文件夹中。可以使用 LLaMA-Factory 仓库进行模型训练。首先安装 llamafactory-cli,然后运行以下命令开始训练:
sh FORCE_TORCHRUN=1 llamafactory-cli train train/collectivesft.yaml
确保 dataset_info.json 和所有必需数据在 data 文件夹中。
评估
可以使用 CMB 仓库生成答案。在 eval 文件夹中提供了一些有用的脚本,帮助快速验证和评分结果。
引用
如果该工作对您的研究有帮助,请引用以下论文:
tex @misc{zhu2024collectivesftscalinglargelanguage, title={CollectiveSFT: Scaling Large Language Models for Chinese Medical Benchmark with Collective Instructions in Healthcare}, author={Jingwei Zhu and Minghuan Tan and Min Yang and Ruixue Li and Hamid Alinejad-Rokny}, year={2024}, eprint={2407.19705}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2407.19705}, }

- 1CollectiveSFT: Scaling Large Language Models for Chinese Medical Benchmark with Collective Instructions in Healthcare中国科学技术大学 · 2024年



