five

肾病专病数据集|肾病诊断数据集|电子病历质控数据集

收藏
天津市数据知识产权登记平台2024-11-11 更新2024-11-25 收录
肾病诊断
电子病历质控
下载链接:
https://dengji.tjippc.cn/xxgg_nr?id=2e4ec07d-3a45-46de-a8d1-6bad10387b4f
下载链接
链接失效反馈
资源简介:
专病诊断名称分类模型:通过分析医学文献、临床数据和专家知识,建立一个诊断数据库。经过分词和打乱顺序的预处理后,使用 train_supervised 函数进行训练(迭代200次,学习率0.1,词N-grams长度为1,损失函数为"hs")。模型性能通过 classification_report 方法评估,表现良好。参数更新通过命令同步模型、标签和标签名,从而快速、准确地诊断专病类型。 电子病历质控分类模型:该模型通过自然语言处理技术对电子病历中的主诉、现病史、既往史等文本进行识别和分析,提取关键信息并进行分类。包含7个类别,每类250个样本。数据处理包括标签化、分词,并转换为TXT文件。用 BERT的分词器将病历文本转化为BERT所需的输入格式,质控标签转换为数值标签。训练集与测试集按9:1比例划分。使用 BertForSequenceClassification模型进行训练。模型评估通过 classification_report 方法进行。参数更新步骤包括将数据放入指定文件夹,运行训练和更新命令,确保模型、标签和标签名同步。
提供机构:
天津健康医疗大数据有限公司
创建时间:
2024-11-05
AI搜集汇总
数据集介绍
main_image_url
特点
肾病专病数据集由天津健康医疗大数据有限公司提供,包含41万条数据,每月更新。数据结构涵盖住院日期、诊断名称、药品名称、检验项目等20个字段。该数据集适用于医疗、教学和科研领域,主要用于诊疗模式研究、药物经济学研究,能够帮助分析肾病的发病率、临床特征及治疗模式,为临床决策提供支持。数据集已通过天津知识产权交易平台存证。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录

TT100K - Tsinghua-Tencent 100K

TT100K数据集是一个用于交通标志检测和识别的大规模数据集,包含100,000张标注的交通标志图像。该数据集主要用于计算机视觉和自动驾驶领域的研究。

cg.cs.tsinghua.edu.cn 收录

中国人口普查分县数据(2000、2010、2020年)

中国人口普查分县数据(2000、2010、2020年)数据集是中国第五次、第六次、第七次人口普查分县数据

国家地球系统科学数据中心 收录

573,264张试卷&练习册&答题卡采集数据【数据堂】

573,264张试卷&练习册&答题卡采集数据。数据包含35,823张试卷、457,970张练习册、79,471张答题卡。数据涵盖多种题型、多种学科、多种类型、多个年级。采集设备为手机、扫描仪。数据可用于智能判卷、作业辅导等任务。我们严格遵循数据保护法规和隐私规定,确保数据采集、存储和使用的过程中维护用户的隐私和合法权益,所有数据均遵循GDPR, CCPA, PIPL

OpenDataLab 收录