five

zyx1234/MuSeR_GPT_OSS_120B_Distillation

收藏
Hugging Face2025-12-18 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/zyx1234/MuSeR_GPT_OSS_120B_Distillation
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含约10万条合成的医学查询和相应的回答,这些数据是从GPT-OSS-120B中提取的。生成这些合成医学查询的方法遵循了一篇名为《通过多方面自我细化学习增强LLMs的医学上下文感知能力》的论文中提出的属性条件生成方法。通过在这个数据集上进行监督微调,可以显著提高大型语言模型(LLMs)的医学对话能力。

This dataset contains ~100k synthetic medical queries and corresponding responses distilled from GPT-OSS-120B. The generation of synthetic medical queries follows an attribute-conditioned generation method proposed in the paper *Enhancing the Medical Context-Awareness Ability of LLMs via Multifaceted Self-Refinement Learning*. We found that supervised fine-tuning on this dataset can substantially improve LLMs medical conversational capabilities.
提供机构:
zyx1234
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作