医疗AI模型训练场景下医疗问答训练数据集
收藏上海市数据产品知识产权管理平台2026-04-16 更新2026-04-17 收录
下载链接:
https://sjdj.sipa.sh.gov.cn/#/home/view/publicNotice
下载链接
链接失效反馈官方服务:
资源简介:
一、数据存储与组织方式:
本数据产品采用分布式数据库进行物理存储,以JSON格式组织数据,核心数据单元为独立问答对,按医疗咨询场景进行分类索引,具体包括症状咨询、用药指导和健康管理等类别。为实现高并发读取与模型训练的高效解析,数据采用键值对直接映射的极简结构,字段无冗余,支持批量读取与高速传输,适配大规模AI模型训练的数据输入需求。
二、字段名称、属性及说明:
1.question(问题字段,文本型):存储用户的医疗咨询内容,涵盖症状描述、疾病疑问、用药咨询、检查解读等场景,表述方式贴近自然语言。
2.answer(答案字段,文本型):存储对应问题的标准化解答,内容基于权威医学指南和临床规范,由医疗专家撰写,确保内容的准确性、专业性与合规性。
三、主关键字段:
本数据集不设置独立的主关键字段,通过JSON数据单元的天然索引关系实现数据追溯与管理,每条问答对即为一个独立的、自包含的索引单元。系统利用分布式数据库的内置机制,为每个JSON对象生成唯一标识,实现数据的精确追溯与高效检索,满足模型训练时对数据样本的随机访问和批量加载需求。
提供机构:
上海库量智能医疗科技有限公司
创建时间:
2026-04-16
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是专为医疗AI模型训练设计的医疗问答训练数据,属于经过加工处理的数据产品。它由上海库量智能医疗科技有限公司申请登记,旨在支持人工智能在医疗领域的问答场景应用开发。
以上内容由遇见数据集搜集并总结生成



