five

microsoft/mediflow

收藏
Hugging Face2025-05-30 更新2025-05-31 收录
下载链接:
https://hf-mirror.com/datasets/microsoft/mediflow
下载链接
链接失效反馈
官方服务:
资源简介:
MediFlow是一个包含约2.5M条记录的大型合成指令数据集,用于临床自然语言处理。该数据集包含700k个独特的指令,覆盖了14种任务类型和98种细粒度的临床文档输入。数据集适用于SFT和DPO对齐,并提供了包括指令、输入示例、输出示例等详细信息的列,以及用于评估的LLM-as-a-Judge评分。

MediFlow is a large-scale synthetic instruction dataset of 2.5M rows (~700k unique instructions) for clinical natural language processing, covering 14 task types and 98 fine-grained input clinical documents. The dataset is suitable for SFT and DPO alignment, and includes columns with detailed information such as instructions, input examples, output examples, and LLM-as-a-Judge scores for evaluation.
提供机构:
microsoft
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作