five

新材料产业产业链结构文本训练数据

收藏
浙江省数据知识产权登记平台2026-05-29 更新2026-05-30 收录
下载链接:
https://www.zjip.org.cn/home/announce/trends/8449820
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集服务于新材料产业的智能分析与图谱构建,通过精准关联企业信息与产业标签,为核心工作提供数据支撑。主要应用于:产业规划,辅助政府及园区掌握生物医用材料、3D打印材料等前沿领域的分布与生态;市场研判,为投资与研究机构分析细分赛道竞争格局、筛选标的提供标准化依据;产业协同,赋能链主企业智能匹配上下游材料供应商与技术伙伴,促进创新链与供应链融合。一、加工前数据说明 本数据集旨在构建用于新材料产业链智能分析的人工智能模型训练语料。在加工前,数据已进行严格的匿名化与去标识化处理。原始企业名称被统一替换为不可逆的规范标识符,简介中的具体地址、联系人等敏感信息已被移除,确保数据完全符合隐私保护与安全合规要求,为模型训练提供了洁净、可靠的输入基础。 二、数据处理规则 数据处理严格遵循 “体系先行、业务匹配、特征抽取” 的核心规则,形成了一套从分类框架构建到最终标签生成的完整流程:1.首先,依据新材料产业分类,预先定义了以“新材料产业”为根节点,下设“前沿新材料”等二级节点,并进一步细分为“生物医用材料制造”、“3D打印用材料制造”、“纳米材料制造”等具体材料门类(三级节点)的树状分类体系。该体系确保了新材料产业分类的逻辑性与专业性。2.业务匹配:依据新材料产业分类,预先定义了以“新材料产业”为根节点,下设“前沿新材料”等二级节点,并进一步细分为“生物医用材料制造”、“3D打印用材料制造”、“纳米材料制造”等具体材料门类(三级节点)的树状分类体系。该体系确保了新材料产业分类的逻辑性与专业性。3.特征抽取:在分类的同时,从企业简介中系统性抽取体现其材料特性、工艺水平或应用领域的关键词(如:“医疗认证”、“定制化生产”、“高性能”、“专利”),组合成“正向词”特征串。该特征作为对分类标签的细粒度补充,刻画了企业的技术优势与产品特点。 三、加工后数据内容 加工后的数据集为一条条结构化的“文本-标签”数据。每条数据均包含脱敏后的企业描述文本,以及与之对应、经人工校验的完整产业链分类标签(一至三级节点)、细分的产业标签以及业务特征词(正向词)。数据内容覆盖了从医用金属、特种化工到先进塑胶、复合材料等新材料产业多个关键领域,形成了一个分类体系清晰、标注专业、特征明确的专用数据集,可直接用于新材料产业图谱构建、企业智能分类与产业链分析等模型的训练与评估。
提供机构:
火石创造科技有限公司
创建时间:
2026-01-23
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含1000条经严格匿名化处理的企业文本-标签数据,覆盖前沿新材料(如生物医用材料、3D打印材料等)领域,基于专业树状分类体系标注了产业标签与业务特征词。主要用于训练AI模型,支持政府产业规划、投资机构市场研判及企业供应链协同等场景下的智能分析与图谱构建。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作