five

医疗大模型监督微调数据集

收藏
山东省数据知识产权存证登记平台2023-12-08 更新2024-05-08 收录
下载链接:
https://sddip.com/djgg/publicDetails/23bbf91bada04a8b8584dd7486cc0ece
下载链接
链接失效反馈
官方服务:
资源简介:
本次构建的大模型监督微调数据集涵盖44个科室、7000个诊断描述、3000个诊断编码。数据集的大小约50万条,其中辅助诊断场景约18万条,辅助编码场景约32万条。数据集存储格式是以json的格式进行存储。

The supervised fine-tuning dataset for large language models (LLMs) constructed in this work covers 44 medical departments, 7000 diagnostic descriptions, and 3000 diagnostic codes. The total number of entries in the dataset is approximately 500,000, including around 180,000 entries for auxiliary diagnosis scenarios and 320,000 entries for auxiliary coding scenarios. The dataset is stored in JSON format.
提供机构:
北方健康医疗大数据科技有限公司
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务