化学研发与技术情报智能体训练数据集产品
收藏上海市数据产品知识产权管理平台2026-05-22 更新2026-05-24 收录
下载链接:
https://sjdj.sipa.sh.gov.cn/#/home/view/publicNotice
下载链接
链接失效反馈官方服务:
资源简介:
本数据集以“百会智能体开源训练数据集”为核心对象,围绕基础对话、逆合成、正合成、反应性预测、选择性预测、物质搜索、三维结构展示、技术预研、可行性分析、配方优化、技术问答、材料方案、情报分析及专利数据库检索等能力进行计算机存储与组织。整体采用“原始数据资源层+结构化样本层+任务标注层+知识索引层”的分层组织方式,其中原始数据资源包括文本语料、分子式、结构文件、反应表达式、专利条目、技术文档与问答记录;结构化样本层用于存放经标准化处理后的训练样本;任务标注层用于保存意图、实体、反应类型、属性标签、问答类别、情报主题等训练标记;知识索引层用于支持检索增强与跨任务调用。核心字段包括:样本ID、任务类型、数据来源、输入内容、标准输出、分子表示形式、反应式、化学名称、文件类型、结构路径、标签集合、质量状态、更新时间、版本号等,其中样本ID为主关键字段,任务类型、数据来源、版本号为重要检索字段。字段属性覆盖字符型、枚举型、时间型、布尔型、数值型及长文本型,并可通过样本ID与任务ID、知识条目ID、文件ID等关联字段实现跨模块组织、检索、追踪和迭代管理。
提供机构:
壹珈智晟(上海)科技有限公司
创建时间:
2026-05-22
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个专用于训练化学研发与技术情报智能体的数据产品,由壹珈智晟(上海)科技有限公司申请登记,类型为数据加工产品,旨在为化学领域的研发与技术情报分析提供训练数据支持。
以上内容由遇见数据集搜集并总结生成



