five

阿里健康医疗大模型自有数据|医疗健康咨询数据集|人工智能数据集

收藏
浙江省数据知识产权登记平台2023-11-14 更新2024-05-08 收录
医疗健康咨询
人工智能
下载链接:
https://www.zjip.org.cn/home/announce/trends/10609
下载链接
链接失效反馈
资源简介:
在“互联网健康咨询、在线辅助问诊、临床决策辅助支持”场景中,通过训练挖掘内容与学科、行业、专业、科室之间的相关性,获取药品、诊断、疾病、检查、检验等诊疗知识,构建出具备自我学习、数据分析、引导提问等能力医疗大模型。辅助医生为用户提供精准、可靠、及时的全流程健康咨询服务,主要包含AI诊前服务和AI诊后服务,AI诊前服务利用大模型技术,提供健康自诊断、知识问答、用药咨询、智能导诊等功能的服务,帮助用户在就医前获得初步的医疗建议和指导;AI诊后服务是指利用医疗大模型技术,在诊后随访、智能评估、专病管理、智能跟踪等院外场景中提供专业的知识服务能力。1.格式清洗:完成QA对答、知识图谱等原始数据的格式统一&清洗,获取内容、学科、数据集类型、数据集来源等信息 2.敏感信息&毒性信息过滤:去除隐私数据和黄赌毒/暴恐/政治等毒性数据。 3.质量过滤:清除语句不通顺、医学专业质量差的数据,并生产质量分字段 4.数据去重:通过模糊匹配和精准匹配完成数据集内部重复数据清除 5.多维度打标:基于质心的聚类,采用k均值算法,计算对象与聚类中心之间的距离,完成学科、类别、行业、专业、科室等字段的打标,便于数据洞察和选择。
提供机构:
阿里健康建模科技(杭州)有限公司
创建时间:
2023-10-24
AI搜集汇总
数据集介绍
main_image_url
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

CHIRPS v2.0

CHIRPS v2.0是一个全球降水数据集,提供高分辨率的降水估计,结合了卫星观测和气象站数据。数据集覆盖全球,时间范围从1981年至今,空间分辨率为0.05度。

www.chc.ucsb.edu 收录

China Health and Nutrition Survey (CHNS)

China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。

www.cpc.unc.edu 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录