five

孕产妇保健数据集

收藏
天津市数据知识产权登记平台2024-10-16 更新2024-10-30 收录
下载链接:
https://dengji.tjippc.cn/xxgg_nr?id=870692d5-5c34-4a2d-b1ae-a50c3b3eed36
下载链接
链接失效反馈
官方服务:
资源简介:
多维诊疗数据构建患者主索引:将患者数据特征向量定义为患者性别、住址、家族遗传病、过敏原等信息,使用DBSCAN算法,基于特征向量的密度,将密度相近的数据点划为同一个簇,将患者数据点进行聚类,每个聚类可以视为一个患者群体,作为主索引的标识。 电子病历质控分类模型:该模型通过自然语言处理技术对电子病历中的主诉、现病史、既往史等文本进行识别和分析,提取关键信息并进行分类。包含7个类别,每类250个样本。数据处理包括标签化、分词,并转换为TXT文件。用 BERT的分词器将病历文本转化为BERT所需的输入格式,质控标签转换为数值标签。训练集与测试集按9:1比例划分。使用 BertForSequenceClassification模型进行训练。模型评估通过 classification_report 方法进行。参数更新步骤包括将数据放入指定文件夹,运行训练和更新命令,确保模型、标签和标签名同步。
提供机构:
天津健康医疗大数据有限公司
创建时间:
2024-10-14
搜集汇总
数据集介绍
main_image_url
特点
孕产妇保健数据集包含151万条多维诊疗数据,每月更新,适用于医疗、教学和科研领域,支持诊疗模式研究和药物经济学分析。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作