five

bootscoder/Medical-ChatBot-SFT

收藏
Hugging Face2025-11-12 更新2025-11-15 收录
下载链接:
https://hf-mirror.com/datasets/bootscoder/Medical-ChatBot-SFT
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集是一个用于监督微调的混合数据集,包含191,760条样本,由30%的通用对话数据和70%的医疗问答数据组成。它旨在将基座模型或CPT模型训练成对话助手,包含来自Alpaca中文指令数据和医疗SFT数据两部分。数据集采用标准Alpaca格式,每条样本包含指令、输入和输出三个字段。

This dataset is a mixed dataset for supervised fine-tuning, containing 191,760 samples, which consists of 30% general conversation data and 70% medical Q&A data. It is designed to train base models or CPT models into conversational assistants, including data from the Alpaca Chinese Instruction Data and the Medical SFT Data. The dataset follows the standard Alpaca format, with each sample containing three fields: instruction, input, and output.
提供机构:
bootscoder
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作