five

医疗大模型高质量发展数据集

收藏
国家基础学科公共科学数据中心2026-02-07 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=6984be8f195d2616afafb2f4&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集依托新一代人工智能重大专项“新一代人工智能风险防范与治理手段研究”,采用多源异构数据集成与文本挖掘技术,系统构建了涵盖医疗人工智能前沿产出的结构化数据库。研究方法侧重于对医疗大模型领域专利、核心学术论文及数据资产交易信息的全量采集,通过专家知识规则与机器学习算法相结合的方式,实现了对中文核心文献与专利技术方案的精准分类与特征提取。数据集时间范围主要聚焦于2024年至2025年医疗人工智能爆发式增长期,时间精度达年度及日量级,空间范围覆盖中国乃至全球主流医疗科技创新策源地。数据涵盖了专利授权详情、中文核心期刊论文元数据以及数据资产化交易实例,质量控制严格执行多轮人工核校验与去重清洗,确保了在统计口径、技术分类与权属信息等维度的高置信度。本数据集对评估医疗大模型技术演进路径、识别关键核心技术壁垒及推动医疗数据资产化合规交易具有极高的学术参考价值与产业决策意义,是支撑医疗垂直领域大模型训练数据治理与高质量标准制定的重要基石。数据量:1.05MB。
提供机构:
清华大学
二维码
社区交流群
二维码
科研交流群
商业服务