five

专利大模型和生物医药大模型应用

收藏
江苏数据交易所2025-06-13 更新2026-01-30 收录
下载链接:
https://exchange.jsdataex.com/trade-home/#/project/tradingMarket/productDetail?productId=1212
下载链接
链接失效反馈
官方服务:
资源简介:
智慧芽已成功训练专利大模型和生物医药大模型,并积极更多垂直领域,正在训练面向材料、通信等领域的大模型,上述大模型合称“智慧芽垂直领域大模型”。其中,专利大模型通过中国专利代理师资格考试的水平,生物医药大模型达到了通过中国执业药师职业资格考试、美国注册药剂师考试(NAPLEX)的水平。在MMLU、C-Eval,Patent-Bench等综合测评结果显示,智慧芽垂直领域大模型在问答、总结、写作、翻译、分类等方面能力整体优于商业通用大模型。在训练数据方面,得益于智慧芽十余年积累的海量高质量科技创新数据,智慧芽垂直领域大模型的预训练数据达到了千亿级token的规模。另外,在智慧芽垂直领域独特的数据配方构成上,还加入了7000余本专业书籍、丰富的行业常识等内容。在AI算法方面,智慧芽围绕数据、算法训练、测试、强化学习构筑了“四位一体”的训练平台。算法上,采用增强式预训练的策略,基于专利和医药领域超40位专家反馈及其2万多条对比数据的强化学习,配合RAG技术,加强大模型理解能力,减少幻觉,对齐人类意图,将大模型精度提升至80%。在应用场景方面,智慧芽面向知识产权、研发创新、生物医药和科创金融等领域的数据产品和服务拥有百万级的专业用户,与其业务流程深度整合。
提供机构:
苏州市人工智能行业协会
创建时间:
2025-06-13
搜集汇总
背景与挑战
背景概述
该数据集聚焦于智慧芽垂直领域大模型,特别是专利和生物医药大模型的应用。这些模型在专业资格考试和综合测评中表现卓越,整体能力优于商业通用大模型,得益于千亿级token的预训练数据和独特的增强式算法训练,精度提升至80%。它们深度整合于知识产权、研发创新等领域的业务流程,服务于百万级专业用户。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务